AlphaGo, la última frontera

El Go, quizá la última barrera para la inteligencia artificial en cuanto a juegos complejos, ya tiene su propio Deep Blue. Y la verdad es que la historia se ha repetido paso a paso.

A finales del mes de enero Google nos informaba de cómo su división Google DeepMind dedicada al aprendizaje profundo y a la inteligencia artificial había desarrollado un programa informático llamado AlphaGo para jugar a Go que aprendiese de sus errores y se volviese cada vez más potente.

Quizá fuese un anuncio más del monstruo informático, pero en enero nos enteramos que derrotó a un match a 5 partidas al jugador profesional el chino Fan Hui (2º dan) – que más tarde se unió al equipo de AlphaGo como consultor – por un rotundo 5-0 en octubre pasado. Así que Deep Mind retó oficialmente Lee Se-Dol, 9º dan, el mejor jugador en la actualidad y uno de los mejores de la historia.

Anuncio Match — Anuncio de la 4a partida

Empezaron a jugar el pasado 8 de marzo, y el mundo entero quedó conmocionado, al igual que pasara hace ya 20 años con Deep Blue, al rendirse Se-Dol tras tres horas y media de juego. Era la primera vez que la IA derrotaba al Campeón Mundial de Go.

A ello le siguieron dos derrotas más del jugador humano hasta que el pasado sábado Lee Se-dol se recompuso y pudo vencer a AlphaGo en la 4º partida. El ahora célebre movimiento 79 de AlphaGo en aquella partida ha sido considerado como un error que no es propio de una máquina, sino más bien de un jugador principiante de Go.

Ello calmó un poco a la raza humana. En GoGameGuru (página de referencia en el mundo del Go) analizaban esa partida y explicaban como Sedol había modificado de forma radical su forma de jugar contra AlphaGo frente a las partidas anteriores. En el movimiento 78 ejecutó lo que se conoce como un «tesuji»(un movimiento especialmente inteligente) que revelaba una táctica que por alguna razón AlphaGo no entendió y a la que respondió de forma extraña. Lo curioso de la situación es que AlphaGo no cometió solo ese error: tras fallar en su respuesta siguió cometiendo errores que parecían derivados de ese primer fallo, haciendo que su situación fuese empeorando y la de Sedol, que aprovechaba gradualmente esa ventaja, acabara ganando la partida.

Pero recordemos que AlphaGo está diseñado para aprender de sus errores. Además, los desarrolladores trabajaron antes del comienzo de la 5º partida, y esta vez Se-Dol fue aplastado. Este se sintió muy decepcionado al finalizar el encuentro: la partida había mantenido la tensión durante cerca de cinco horas y ha agotó los periodos de tiempo iniciales y parte de los tres tiempos extra que se conceden a los jugadores. De hecho quedaban ya pocas posiciones que ocupar pero parece que Sedol vio claro que su posición final iba a ser inferior a la que AlphaGo había ido construyendo a lo largo de la partida.

El resultado final ha sido contundente: 4-1 para la máquina. Todas las partidas se han podidio seguir y se puede reproducir con comentarios en directo en el canal de Youtube de la División DeepMind. Aquí ponemos un resumen de la histórica 4ª partida:

Deep Blue

¿Les recuerda algo esta historia? El hito recuerda al que logró Deep Blue al ganar a Gari Kasparov aquella primera partida de ajedrez en 1996. Kasparov acabaría ganando el match de aquel año, pero Deep Blue lograría ganar el rematch un año más tarde, algo que dejó claro que en el mundo del ajedrez el reto se había logrado al fin. Además, se han dado pasos muy similares: una importante compañía (que lleva en su nombre “Deep”), se introduce en el mundo de la Inteligencia Artificial, maestros que tras probar el programa se pasan al equipo desarrollador, movimientos de la máquina extraños durante el encuentro, cambio a una estrategia anti-máquina por parte del maestro humano….. ¿nos extrañaría llegar a conocer que algún componente de Deep Blue trabaja para DeepMind?

La cosa parecía mucho más compleja en Go, donde las combinaciones de posibles posiciones son mucho mayores y donde la intuición juega un papel importante. AlphaGo ya había demostrado haber logrado su capacidad en el enfrentamiento del mes de octubre de 2015, pero la prueba definitiva era la de jugar contra un oponente humano aún más fuerte.

¿El futuro?

Esta victoria de AlphaGo confirma que el desarrollo de los ingenieros de Google DeepMind ha logrado el objetivo de jugar a Go de forma casi perfecta gracias al uso de la inteligencia artificial y de las técnicas de aprendizaje por refuerzo que han sido vitales en la evolución de su forma de jugar. Queda por ver cuál es el próximo logro de los responsables de esta división de Google, que por ejemplo han anunciado una colaboración con el National Health Service en el Reino Unido, el servicio de sanidad pública con el que, por lo visto, se plantea una aplicación básica de seguimiento de datos que podría dar lugar a mejores diagnósticos en todo tipo de pacientes.

La última frontera de la inteligencia donde la raza humana aún nos considerábamos imbatibles ha caído. ¿Qué nos deparará el futuro?

Compujedrez 2016

Fuentes: XacataCiencia, DeepMind, GoGameGuru