Seleccionar página

¿Qué diablos es esto? Así es como sueña una computadora, por supuesto. Imagen: Investigación de Google

En su libro Do Androids Dream of Electric Sheep, uno de mis escritores favoritos, Philip K. Dick, explora lo que diferencia a los humanos de los androides. El tema es más válido hoy que nunca, considerando los grandes avances en inteligencia artificial que estaban saliendo de los principales laboratorios tecnológicos de todo el mundo, como Google. Tomemos, por ejemplo, cómo la empresa emplea redes neuronales artificiales avanzadas para recorrer miles de millones de imágenes, interpretarlas y devolver la correcta que está buscando cuando realiza una consulta utilizando el motor de búsqueda. Aunque no se parece en nada a un cerebro humano, las redes utilizan de 10 a 30 capas apiladas de neuronas artificiales y cada capa hace su trabajo en orden incremental para llegar a una respuesta en la capa de salida final. Si bien no es definitivo, la red parece arrojar mejores resultados que cualquier cosa que hayamos visto antes y, como subproducto, también puede soñar. Estos sueños artificiales producen algunas imágenes fascinantes, por decir lo menos, pasando de prácticamente nada (ruido blanco) a algo que parece una pintura surrealista. ¿Quién dice que las computadoras no pueden ser creativas?

Los ingenieros de Google tuvieron la amabilidad de decirnos cómo funciona la IA, pero también compartieron algunas imágenes que muestran cómo ve o sueña la red neuronal de Google en una publicación reciente del blog.

Antes de que pueda identificar objetos por sí misma, la red neuronal está entrenada para comprender qué son esos objetos. Al alimentar millones de fotos, los investigadores le enseñan a la red qué es una bifurcación, por ejemplo. La red sabe que un objeto que tiene un mango y de 2 a 4 dientes es probablemente un tenedor, sin involucrarse demasiado en detalles como el color, la forma o el tamaño. Una vez que aprende, revisa las imágenes a través de su red neuronal capa por capa, cada vez que analiza algo diferente o amplifica una característica definida, hasta que puede identificar esa bifurcación. Sin embargo, en el camino, la IA puede fallar. Por lo tanto, para saber si hace un buen trabajo o saber qué capa no está funcionando como debería, es útil visualizar la representación de redes de una bifurcación. En la imagen de abajo, puedes ver cómo pensaba la IA que era una mancuerna.

Imagen: Investigación de Google

Como puede ver, la IA no puede extraer la esencia de lo que es una mancuerna sin unir también algunos bíceps o músculos humanos en la imagen. Probablemente, porque la mayoría de las imágenes de mancuernas han sido alimentadas con cuchara y mostraban a personas levantando pesas. Al visualizar estos contratiempos, los ingenieros aprenden por su cuenta cómo funciona su sistema (es tan complejo que, aunque lo diseñaron ellos, a veces parece que la IA tiene mente propia) y lo construyen mejor para que se ajuste a sus expectativas.

Normalmente, la primera capa busca bordes y esquinas analizando el contraste; las capas intermedias buscan características básicas como una puerta o una hoja; la capa final reúne todos los datos en una interpretación completa. Otro enfoque que usa Google para comprender qué sucede exactamente en cada capa es trabajar al revés y pedirle a la IA que mejore una imagen de entrada de una manera que provoque una interpretación particular. Por ejemplo, los ingenieros le preguntaron a la red neuronal cómo cree que debería verse una imagen que representa un plátano, todo a partir de un ruido aleatorio. En la publicación del blog, escriben que no funciona muy bien, pero funciona si imponemos una restricción previa de que la imagen debe tener estadísticas similares a las imágenes naturales, como que los píxeles vecinos deben correlacionarse.

Imagen: Investigación de Google

Aquí hay algunos otros ejemplos en diferentes clases.

Imagen: Investigación de Google

Como se mencionó anteriormente, cada capa de Google AI amplifica una característica determinada. Aquí hay algunas imágenes que muestran cómo la IA amplifica las funciones en una determinada capa tanto para fotos como para dibujos o pinturas.

Imagen: Investigación de Google Imagen: Investigación de Google

Se vuelve mucho más interesante cuando avanzas más en las capas neuronales donde la IA comienza a interpretar las cosas en un nivel más abstracto. Esto es lo que sucedió cuando los investigadores le preguntaron a la IA lo que sea que veas allí, ¡quiero más!

Imagen: IA de Google

Este me pareció realmente fascinante. Puedes ver muchos patrones y cosas apareciendo cuando miras las nubes en el cielo: el mapa de un país, patos, los senos de una mujer. Las posibilidades pueden ser infinitas. Eso es porque el cerebro humano es muy bueno para encontrar y ajustar patrones. Así es como pudimos dar sentido al mundo y, en mayor medida, eso es lo que nos convierte en una especie tan exitosa. Por supuesto, a veces confundimos los patrones que vemos con la realidad. Es por eso que algunas personas ven cosas que parecen pirámides en Marte y piensan que los extraterrestres marcianos inteligentes son reales. En la imagen de arriba, la red neuronal de Google interpretó algunas características como pájaros, amplificó esto y luego comenzó a ver pájaros en todas partes. Aquí hay algunas abstracciones altas más interesantes.

Imagen: Investigación de Google

Al igual que los humanos, la red neuronal de Google también está sesgada hacia ciertas características debido al tipo de imágenes que se alimentan. La mayoría de las imágenes son de animales, edificios, puntos de referencia, etc. Naturalmente, interpreta estas características incluso cuando no están presentes.

Imagen: Investigación de Google

Los investigadores de Google también se volvieron un poco creativos e instruyeron a la red para que tomara la interpretación final de la imagen que produjo y la usara como la nueva imagen para procesar. Esto genera un flujo interminable de nuevas impresiones.

Imagen: Investigación de Google Imagen: Investigación de Google

En última instancia, este tipo de interpretaciones, aunque increíblemente divertidas de presenciar, son muy importantes. Ayuda a Google a comprender y visualizar cómo las redes neuronales pueden realizar tareas de clasificación difíciles, mejorar la arquitectura de la red y verificar lo que la red ha aprendido durante el entrenamiento. Pero el mismo proceso también podría ayudar a los humanos a subrayar su propio proceso creativo. Nadie sabe exactamente qué es la creatividad humana. ¿Es inherente a los humanos o una máquina también puede ser creativa? La red neuronal de Google, pero también otros ejemplos como este chatbot extremadamente ingenioso, insinúan lo último. No sé ustedes, pero eso suena increíble y aterrador al mismo tiempo.

"