El arte de la inteligencia artificial

by Ehsan

El arte de la inteligencia artificial

[ad_1]

A mono como La joven de la perla, de Johannes Vermeer creado para la IA DALL E en menos de treinta segundos.

A mono como La joven de la perla, de Johannes Vermeer creado para la IA DALL E en menos de treinta segundos.

El hueso locomotoras años 20 del siglo pasado transformaron cualquier manifestación artística. Las nuevas tecnologías de entonces, la fotografía y el cine, disparan la creatividad. Estos locomotoras años 20 del siglo XXI dibuja un nuevo elemento tecnológico transformador: inteligencias artificiales fáciles de usar, disponibles para todos los públicos, que crean fotos, cuadros, vídeos, cualquier cosa, a partir de un texto escrito. Pueden ser tan realistas como las imágenes captadas por una cámara, en un estilo artístico que imita a los grandes pintores de la historia.

GAN, el algoritmo creado por Obama

En el año 2018 salía a subasta el cuadro El reverso de Edmond de Belamy presentado por el colectivo Obvious y confirmado por un algoritmo numérico GAN. Este artista artificial desarrollado en 2014 fue muy conocido por los famosos malo malo o generación de fídeos falsos como la realización con el rostro de Barack Obama.

El vídeo comienza con un Indistinguible Obama del real diciendo esta frase: «Estamos entrando en una era en la que nuestros enemigos pueden hacer que cualquiera diga cualquier cosa en cualquier momento».

IA disponibles

Los nuevos modelos no limitan a crear en base al aprendizaje de imágenes previas sino que además fortalecen las relaciones con el texto.

En los últimos tiempos han ido apareciendo nuevos números como DALL E 2, Imagen, Craiyon, Midjourney, Nuwa-Infinity, Stable-Diffusion… una descripción, un texto. Sus diferencias pueden estar en el estilo final, sus posibilidades de edición o las restricciones de uso. Pero el principio es el mismo.

¿Cómo puede una IA ser capaz de generar una imagen a partir del texto?

Piensa en el proceso natural para transformar un mensaje de texto en una imagen. Por ejemplo: «Pinta un árbol al atardecer en un día de otoño». Cada humano pintará un árbol distinto. No hay cremas que tengan una imagen literal de los elementos que tienen en forma secuencial, si no más plasmamos una abstracción mucho más genérica sobre la que añadimos más detalles en función de las iteraciones que realizamos en torno a esa abstracción.

Al leer un texto localizamos las palabras más relevantes. Por ejemplo, no tanto la misma importancia a los verbos que a los artículos, tampoco podemos evitar capturar un significado y seguramente tampoco un sentimiento: el texto podrá parecer gracioso, triste, nostálgico…

En general, hay una serie de asociaciones que se despliegan y que con un poco de esfuerzo representamos en un dibujo o una canción.

Un modelo generativo de imagen tipo DALL · E no está muy lejos de esta intuición.

La famosa neurona de Jennifer Aniston

Pese que la IA no pretende simular fielmente nuestro proceso cognitivo, si que surgen algunas similitudes entre el mundo artificial y el biológico.

Si las representaciones en el mundo biológico son estables en redes neuronales, en el mundo sintético residen en matrices numéricas, éstas son espacios latentes que condensan lo más representativo del mundo que pretende generar.

En 2005 se publicó un artículo de investigación en La naturaleza recogía que disponemos de neuronas específicas para cada concepto particular. Por ejemplo, siempre se activa la misma neurona cuando vemos una foto de Jennifer Aniston, o una caricatura o su nombre escrito. Este efecto recibió el número de neuronas de Jennifer Aniston.

Del mismo modo, los desarrolladores de OpenAI, compañía detrás de la inteligencia artificial DALL·E, recogen en una publicación reciente la existencia de neuronas artificiales, repetimos, neuronas artificiales, que reaccionaron a conceptos similares, tanto si la entrada es una fotografía como si eres un dibujo. La roja en este caso es capaz de comprimir con una serie de parámetros numéricos la variabilidad que representa un personaje famoso independientemente de su entrada.

Pero tener la idea de una obra es solo el principio, plasmarla tiene más mérito.

Descodificación

Para transformar la parte conceptual en la imagen real existe en varios estratos. Por ejemplo, DALL·E 2 no genera desde un lienzo en blanco sino a de ruido que, guiado por el texto que hemos introducido, s’transta paulatinamente en la imagen que estamos buscando. Esta nueva forma hizo que DALL·E en su versión 2 fuera preferida respecto a su predecesora, tanto por su comprensión y manipulación como por su fotorrealismo.

DALL·E no ve igual que Difusión Estable

Los artistas no solo se nutren de técnica sino de experiencia. La experiencia de la IA se basa en datos, con el sistema teniendo su funcionamiento y evolucionando con un estilo más realista (DALL·E 2) o más artístico (Midjourney).

Stable Diffusion es un proyecto fuente abierta. Así, los desarrolladores de software Puedes crear herramientas más sofisticadas e integrarlas en otros programas de edición de imágenes, música y videos.

DALL E 2 ofrece una buena comprensión del texto y facilidad de uso en herramientas como el pintar para la integración de nuevos elementos en áreas específicas de la imagen o el sobrepintar ampliar el enlace de una imagen para añadir contenido al alrededor.

¿Es arte? Se lo hemos preguntado a GPT-3

De la misma manera que la fotografía empujó hacia el realismo pictórico y nuevos estilos artísticos como el postimpresionismo, los nuevos generadores de IA impulsaran la creatividad hacia nuevas direcciones.

Pero veamos qué opina GPT-3, un tipo de arquitectura diseñada para procesar la longitud natural, que está en la base DALL·E.

¿Consideras que las imágenes de DALL·E son similares al arte hecho por humanos?

GPT-3 IA: No creo. Creo que es interesante ver qué tipo de imágenes crea DALL·E a from textual descriptions, pero no creo que sean como el arte humano.

¿Por que no?

GPT-3 IA: Creo que el arte humano fue creado desde una perspectiva diferente a la de DALL·E. El arte humano se crea desde la perspectiva y el contexto propios del artista, mientras que DALL·E creó imágenes a partir de una descripción textual.

Definir contexto del artista

GPT-3 IA: El contexto del artista se refiere a la perspectiva y el contexto que este trae a su trabajo. Incluye su historia personal, su cultura, sus valores y su propia forma única de ver el mundo.

Este artículo fue publicado originalmente en The Conversation. Leah el original.

Arturo Fuentes Calle no recibe salario, ni ejerce labores de consultoría, ni posee acciones, ni recibe financiación de ninguna compañía u organización que pueda obtener beneficio de este artículo, y ha declarado carecer de vínculos relevantes más allá del cargo académico citado.

[ad_2]

Source link