DALL-E ahora puede ayudarte a imaginar lo que hay fuera del marco de las pinturas famosas.

by Ehsan

DALL-E ahora puede ayudarte a imaginar lo que hay fuera del marco de las pinturas famosas.

[ad_1]

OpenAI ha agregado una nueva función de «señalamiento hacia afuera» a su modelo de IA de texto a imagen DALL-E que permite que el sistema genere nuevas imágenes que expanden los bordes de una imagen determinada.

En el ejemplo anterior, puede ver cómo DALL-E, con la ayuda de indicaciones humanas, «imagina» lo que está fuera del marco del retrato de Johannes Vermeer «La chica de la perla». Observe cómo, incluso a partir de la información limitada proporcionada por el retrato, el sistema puede igualar el estilo de Vermeer, imitando las sombras y los reflejos del original.

En el lapso de tiempo a continuación, también puede ver cómo el artista a cargo, August Kamp, tuvo que ampliar la imagen en pequeñas secciones a la vez, a menudo rehaciendo DALL-E generaciones para lograr el resultado deseado. Lo que no se ve en este video pero que sin duda vale la pena resaltar es el hecho de que el sistema no genera estas extensiones por sí solo. Al igual que con cualquier IA de texto a imagen, el modelo requiere que los humanos describan las nuevas imágenes.

La función Outpainting se puede utilizar para ampliar el contenido original, pero, por supuesto, muchos usuarios de DALL-E han jugado con esta función para ver qué hay fuera del marco de las imágenes famosas. (Desplácese hacia abajo para ver mi ejemplo favorito absoluto…)

Desde una perspectiva más amplia, la pintura no amplía realmente la funcionalidad central de los sistemas de IA de texto e imagen, pero muestra cómo OpenAI probablemente se posicionará en el creciente mercado de tales sistemas: al hacer que la facilidad de uso sea un argumento clave para los clientes.

Muchos modelos de IA de texto a imagen pueden realizar la misma función esencial que la pintura, pero, al igual que DALL-E antes de esta actualización, requería bastantes ajustes manuales. Hacer que pintar sea lo más fácil posible ayudará a DALL-E a diferenciarse de la creciente competencia de sistemas más pequeños pero comparables como Midjourney y Stable Diffusion.

DALL-E en sí ya está disponible a través de un programa beta, que actualmente tiene acceso a más de un millón de usuarios. Cada usuario beta obtiene 50 compilaciones de imágenes gratuitas en el primer mes, luego 15 usos más cada mes después de eso. Luego pueden comprar 115 generaciones adicionales de imágenes por $15.

Mientras tanto, sin embargo, la pintura se puede usar para responder algunos de los mayores misterios de la vida, como «¿y si el tipo de Quaker Oats fuera un cantinero tetona?» Extrañar más:

[ad_2]

Source link