Seleccionar página

Hemos llegado a entender que los jugadores humanos nunca tendrán una oportunidad contra una computadora con suficiente poder de fuego en juegos finitos y abiertos como las damas o el ajedrez. El póquer es sensiblemente diferente porque la computadora no conoce las manos de sus oponentes humanos. No importa, un grupo de informáticos de la Universidad de Alberta en Canadá ha programado una IA para jugar al póquer Texas Holdem heads-up tan bien (o perfecto según sus autores) que no puede perder frente a ningún oponente. Hay una esencia, aunque solo puede ganar en Texas Hold'em con límite, donde hay un límite de cuánto puedes apostar, de lo contrario, simplemente no puede manejarlo.

El póquer se ha resuelto casi

Crédito de la ilustración: PETER Y MARIA HOEY

El programa de computadora en cuestión se llama Cepheus y es el primero en jugar un juego de póquer esencialmente perfecto, según sus creadores. En los términos más simples, la IA está programada para jugar con una estrategia que garantiza no perder dinero a largo plazo, estadísticamente hablando. En otras palabras, sí, la computadora perderá algunas manos, pero dado el tiempo y las manos suficientes, es seguro que ganará.

Sin embargo, es algo más que ganar en el póquer. Se trata de marcar un hito en la inteligencia artificial y la teoría de juegos. Anteriormente, los juegos como las damas, conecta 4, Othello y el ajedrez se habían resuelto, dejando pocas oportunidades para que un jugador humano supere a la computadora. Todos estos juegos, sin embargo, tienen en común una característica importante: todos tienen información perfecta , donde todos los jugadores tienen toda la información relevante para tomar sus decisiones. En este sentido, el póquer es la antítesis de la información perfecta donde la información más relevante, las cartas de los otros jugadores, es exactamente lo que no se conoce.

En general, en cualquier juego de póquer de holdem con límite cara a cara hay 3 x 10 ^ 14 decisiones posibles, lo que significa que una computadora tendría que funcionar con 262 terabytes de memoria para poder resolverlo. Por suerte, usando algoritmos puedes refinar el juego y solo considerar aquellas decisiones que son importantes. El equipo canadiense ideó un algoritmo de este tipo llamado minimización de arrepentimiento contrafactual (CFR), que esencialmente se trata de aprender de los errores del pasado. Cuando Cepheus piensa en hacer una apuesta y finalmente decide apostar al azar, si pierde, almacenará esa información. Más tarde, volverá sobre sus pasos y verá cuánto habría ganado si el programa hubiera apostado correctamente; este es el valor de arrepentimiento. De esta forma, el algoritmo evitará cometer el mismo error dos veces, escriben los autores en la revista Science .

Con suficientes manos, eventualmente cometerá suficientes errores para jugar casi a la perfección. De hecho, jugó 24 billones de manos de póquer durante 70 días en 200 computadoras que ejecutaban el algoritmo CFR+ con 32 GB de RAM y 24 unidades centrales de procesamiento. Ahora, Cepheus solo usa 11 terabytes de ram. A continuación, los investigadores planean ajustar Cepheus para jugar al póquer sin límite, donde se puede enviar cualquier apuesta de cualquier valor. En este caso, la cantidad de combinaciones posibles es absolutamente astronómica, pero aun así los autores esperan que la computadora pueda vencer incluso a los mejores jugadores del mundo.

Historia a través de ASAP Science