En lo que parecía imposible hace apenas unos años, una computadora ha vencido a un campeón de Go. Los informáticos de la división DeepMind de Google en el Reino Unido lograron esta hazaña, con su inteligencia artificial (IA) derrotando a un humano.

Juego antiguo, nuevos jugadores

Go es un juego antiguo. Fue inventado en China, hace más de 2.500 años. Aparentemente simple, Go es en realidad un juego increíblemente complejo. Lo juegan dos personas, que tienen piezas blancas o negras. El objetivo es rodear más territorio que el oponente. Hay una gran cantidad de teoría y estrategia involucrada en el juego y el número total de movimientos en Go se estima en 10 761 en comparación, por ejemplo, con los 10 120 estimados posibles en el ajedrez. En otras palabras, Go es mucho más complejo que el ajedrez.

El juego de Go ha sido visto durante mucho tiempo como el más desafiante de los juegos clásicos para la inteligencia artificial debido a su enorme espacio de búsqueda y la dificultad de evaluar las posiciones y movimientos del tablero, escriben en el estudio.

Para aún más términos de comparación, el número total de átomos en el universo se estima en alrededor de 10 80 . No hace falta decir que tratar de descifrar Go con una computadora como lo harías con el ajedrez realmente no va a funcionar.

Los métodos tradicionales de inteligencia artificial que construyen un árbol de búsqueda sobre todas las posiciones posibles no tienen ninguna posibilidad en Go, escribe el fundador de DeepMind, Demis Hassabis, en una publicación de blog de Google. Entonces, cuando nos dispusimos a descifrar Go, adoptamos un enfoque diferente.

Su enfoque fue construir un sistema que combina una red neuronal y una búsqueda de árbol avanzada. Su sistema, llamado AlphaGo, aprendió de unos 30 millones de movimientos en juegos jugados por expertos humanos, hasta el punto en que podía anticipar los movimientos de los oponentes con una precisión del 57 por ciento del tiempo, superando el récord anterior del 44 por ciento.

Luego, el siguiente paso fue hacer que AlphaGo jugara contra sí mismo, ajustando sus estrategias de prueba y error jugando miles y miles de juegos contra sí mismo. Después de eso, lo hicieron jugar contra otras Go AI, donde prácticamente aplasta a la competencia. Pero la primera demostración real fue contra el actual tres veces campeón europeo de Go, Fan Hui. Aquí es donde se pone interesante.

Computadora vs Humano

En 2014, hace menos de dos años, Wired escribió este interesante artículo sobre Go, llamándolo el juego misterioso en el que las computadoras no pueden ganar. Estimaron que pasarán otros 10 años antes de que las computadoras superen a los humanos en este juego de estrategia y parecía una afirmación razonable. Las computadoras ya estaban venciendo a los humanos en las damas en 1994, y en 1997, Deep Blue AI venció al famoso campeón mundial Garry Kasparov, pero Go se mantuvo firme; hasta ahora.

La computadora ganó 5 juegos sin perder uno solo. Jugó tan bien como su oponente y no cometió ningún error.

El problema es que los humanos a veces cometemos errores muy grandes, porque somos humanos. A veces estamos cansados, a veces queremos ganar el juego, tenemos esta presión, dijo Fan a Elizabeth Gibney en Nature , describiendo el partido. El programa no es así. Es muy fuerte y estable, parece una pared. Para mí esto es una gran diferencia. Sé que AlphaGo es una computadora, pero si nadie me lo dijera, tal vez pensaría que el jugador es un poco extraño, pero un jugador muy fuerte, una persona real.

Ahora, solo hay un desafío para que Go AI juegue contra el surcoreano Lee Sedol, considerado el mejor jugador de Go del mundo. Ya sea que derrote o no al campeón de Go, AlphaGo hizo su punto: Go sigue siendo un juego de posibilidades limitadas, y las computadoras vencerán a los humanos más temprano que tarde. Pero para sus creadores, no son solo los logros de la competencia, sino la forma en que aprendió y se volvió tan bueno en el juego.

Estamos encantados de haber dominado Go y haber logrado así uno de los grandes desafíos de la IA, escribe Hassabis. Sin embargo, el aspecto más significativo de todo esto para nosotros es que AlphaGo no es solo un sistema experto construido con reglas hechas a mano; en su lugar, utiliza técnicas generales de aprendizaje automático para descubrir por sí mismo cómo ganar en Go. Si bien los juegos son la plataforma perfecta para desarrollar y probar algoritmos de IA de manera rápida y eficiente, en última instancia queremos aplicar estas técnicas a problemas importantes del mundo real.

Referencia del diario: Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles

"