Seleccionar página

DALL-E mini es un programa basado en IA de uso gratuito que puede generar imágenes e ilustraciones originales a partir de un texto de entrada. No es perfecto, especialmente con las caras o los detalles, pero sigue siendo muy bueno. Pero también hace algo raro.

Algunos usuarios notaron recientemente que cuando el programa se ejecuta sin dar ningún aviso, la mayoría de las imágenes que produce son de mujeres en saris (ropa tradicional de mujer en India y Nepal). Este peculiar comportamiento de DALL-E mini ha desconcertado a los expertos en inteligencia artificial, incluido su creador.

Una compilación de resultados de entrada en blanco en DALL E mini. Créditos de imagen: DALL E mini/Hugging Face

Desde su lanzamiento en julio de 2021, DALL-E mini ha estado creando imágenes a partir de indicaciones de texto y mejorando constantemente su resultado. El ingeniero de aprendizaje automático Boris Dayma creó este proyecto en línea como una alternativa de código abierto a DALL.E 2, un programa OpenAI que funciona de la misma manera que DALL-E mini pero es más potente y solo pueden acceder algunos investigadores. OpenAI es una organización de investigación fundada por Elon Musk (él dejó el proyecto) y Sam Altman (director ejecutivo actual) que se centra en las innovaciones basadas en el aprendizaje automático (DALL E mini no está asociado ni es propiedad de Open AI).

Aunque la mayoría de las imágenes producidas por esta inteligencia artificial creativa vienen con secciones borrosas y distorsionadas o con imperfecciones significativas, DALL-E mini puede producir imágenes para los pensamientos más extraños que surgen en tu mente. Desde robots vampiros hasta ciudades voladoras y gatitos haciendo yoga en el Himalaya, cualquier entrada que ingreses, DALL E mini generará imágenes para eso. Pero, ¿por qué muestra mujeres en saris cuando un usuario lo ejecuta sin ingresar texto?

Imágenes creadas por DALL E mini para texto Vampire robots. Créditos de imagen: DALL E mini/Hugging Face

La prueba sin aviso con DALL E mini

La obsesión por el sari de DALL E mini fue reportada por primera vez por el guionista brasileño y exhacktivista Fernando Mars en junio de 2022. Mars ha estado experimentando con las entradas de DALL E mini durante algún tiempo y luego pensó en probar el programa sin dar ninguna indicación. Después de realizar algunas consultas en blanco, se encontró con un hallazgo extraño.

Mars notó que durante cada prueba, los resultados incluían al menos una imagen de una mujer en un sari. Como solo había realizado unas pocas pruebas, pensó que podría ser una extraña coincidencia. Entonces, para confirmar aún más la obsesión de la mujer en sari con la IA, Mars decidió realizar más pruebas. Afirma que él y sus amigos realizaron consultas en blanco en DALL E mini varias veces durante aproximadamente 10 horas y generaron 5000 imágenes originales utilizando el mismo programa de IA.

Sorprendentemente, una gran cantidad de las imágenes creadas por DALL E mini durante las pruebas de entrada en blanco eran de mujeres con saris. Sari es un vestido usado principalmente por mujeres hindúes en países del sur de Asia como India, Nepal y Sri Lanka, y se considera un símbolo de pureza, orgullo nacional y cultura en muchas de estas naciones. Además, los saris hechos con los métodos tradicionales de tejido a mano también tienen importancia económica porque sirven como fuente principal de ingresos para millones de tejedores en telares manuales solo en la India.

Pero la gran pregunta es ¿qué tiene que ver una IA con mujeres en saris? Cuando se le hizo esta pregunta al creador de DALL E minis, Dayma, le dijo a Rest of World que incluso él estaba desconcertado:

Es bastante interesante y no estoy seguro de por qué sucede. También es posible que este tipo de imagen estuviera muy representada en el conjunto de datos, tal vez también con subtítulos cortos.

Ninguna entrada devuelve dibujos vagos o símbolos de tipo mandala junto con mujeres en saris.

Además de las razones relacionadas con el conjunto de datos y los subtítulos, otro factor que podría afectar los resultados de DALL E minis es su entrenamiento de filtro de datos. Algunos expertos en inteligencia artificial sugieren que es posible que las imágenes de mujeres con sari hayan permanecido sin etiquetar durante el entrenamiento del mini modelo DALL E. Entonces, cuando se ejecuta una prueba de entrada en blanco, la IA selecciona las imágenes y los datos sin etiquetar y los procesa para dar imágenes de mujeres en sari (DALL E mini crea imágenes procesando millones de subtítulos e imágenes ya disponibles en Internet).

Sin embargo, no todos los expertos en aprendizaje automático están de acuerdo con estas explicaciones. Michael Cook, un investigador de IA de la Universidad Queen Mary de Londres, argumenta que, en general, es poco probable que el conjunto de datos de IA incluya más imágenes de personas del sur de Asia o las imágenes que tienen subtítulos en un idioma que no sea inglés. Muchas de las imágenes de mujeres en sari en Internet no tienen subtítulos en inglés sino en hindi.

Él cree que la aparición frecuente de imágenes de saris podría estar relacionada con la forma en que se filtran los datos, pero esto también es solo una teoría.

Lo que podríamos estar viendo es un efecto secundario extraño de parte de este filtrado o preprocesamiento, donde las imágenes de mujeres indias, por ejemplo, tienen menos probabilidades de ser filtradas por la lista de prohibición, o el texto que describe las imágenes se elimina y son agregado al conjunto de datos sin etiquetas adjuntas, dijo Cook.

DALL E mini se está convirtiendo en una sensación en Internet

Desde su lanzamiento, DALL E mini atrae a nuevos usuarios todos los días. Ha dado lugar a que muchos identificadores de Twitter tengan más de medio millón de seguidores, por ejemplo, la cuenta de Twitter llamada Weird Dall-E Mini Generations tiene actualmente 987,5 K seguidores. La popularidad del programa de IA se puede imaginar por el hecho de que procesa casi 5 millones de entradas diariamente.

Resultados de búsqueda de una pintura de la civilización felina en Marte en DALL E mini. Créditos de imagen: DALL E mini/Hugging Face

Cualquiera puede generar imágenes usando DALL E mini (el nombre del sitio web oficial es huggingface.co), todo lo que necesita hacer es escribir una entrada (por ejemplo, una pintura de la civilización de gatos en Marte) y hacer clic en el botón Ejecutar. En un par de minutos, las imágenes originales se presentan ante usted. Sin embargo, esta poderosa habilidad de DALL E mini también se considera una amenaza para artistas humanos como ilustradores, pintores y diseñadores gráficos.

Sería muy interesante ver por qué desarrollo adicional pasan las IA como DALL E mini en los próximos años y cómo esos cambios afectan la vida humana.

"