Cepheus, un robot-joueur de poker imbattable et qui peut soigner le diabète
Si vous pensiez qu'un jeu d'information incomplète comme le Texas Hold'em ne pourrait jamais être résolu par un être humain ou une machine, il va falloir revoir votre position.
Selon une étude du magazine Science du 09 janvier, un groupe de scientifiques de l'Université d'Alberta a trouvé le moyen de résoudre le jeu et a publié les résultats des recherches qui les ont menés à cette conclusion.
Le Fixed Limit Hold'em résolu par un ordinateur
Ces dernières années, Michael Bowling, Neil Burch, Michael Johanson et Oskari Tammelin ont travaillé à un programme informatique appelé Cepheus — un 'bot' dont les concepteurs affirment qu'il ne peut être battu par aucun joueur de poker humain. Jamais.
"Ici, nous annonçons que le Texas Hold'em à limite fixe en tête-à-tête est quasiment résolu" affirme l'étude. Selon les chercheurs, leur système n'offre aucune garantie de "gagner de l'argent à chaque main, mais de gagner sur le long terme, si l'on prend en compte toutes les mains qui peuvent survenir et que l'on fait la moyenne, alors l'ordinateur ne peut pas perdre – il est soit à l'équilibre soit gagnant".
Dans une interview donné au site dédié aux nouvelles technologies The Verge, Bowling, ingénieur informatique et coauteur de l'étude explique que Cepheus fonctionne en cherchant dans une base de données contenant des situations de jeu prédéfinies afin de prendre la décision optimale dans chaque main.
La base de données a été construite en laissant l'ordinateur jouer contre lui-même, ce qui lui a permis d'apprendre tous les scénarios possibles auxquels un joueur peut être confronté à un moment donné, explique l'un des coauteurs, Johanson.
"Nous avons eu une phase d'apprentissage où le logiciel a commencé à jouer de manière aléatoire contre lui-même". Selon Johanson, l'ordinateur n'avait "aucune idée de ce qu'il faisait, si ce n'est de suivre les règles du jeu".
Ce processus a permis à Cepheus d'apprendre tous les moves possibles dans le jeu et de trouver ceux qui mènent à la réussite, même dans un jeu d'information incomplète comme le poker.
Apprendre de ses erreurs pour avoir un "jeu parfait"
"[Cepheus] pense à toutes les décisions possibles à chaque moment et à toutes les actions possibles [à partir de ce moment]" explique Bowling à The Verge. Par exemple, le programme peut se demander "Que se passe-t-il si je raise maintenant ? Combien d'argent supplémentaire puis-je gagner ou perdre ?".
Ainsi, le programme prend en compte toutes les conséquences possibles de toutes les décisions possibles, en calculant les possibilités de gagner et les montants d'argent ou de jetons que lu fait gagner ou perdre.
De cette manière, si une stratégie aléatoire coûte de l'argent, Cepheus trouve une stratégie différente. Cela permet à Cepheus d'utiliser des stratégies différentes dans chaque main, d'apprendre de ses erreurs et d'atteindre ce que Bowling appelle "un jeu parfait".
Les scientifiques expliquent que pendant la phase d'apprentissage du robot, ils ont utilisé un ensemble ''de 200 ordinateurs, chacun équipé de 32 GB de RAM et de 24 processeurs d'unité centrale'' pendant 70 jours. D'après Johanson cela a suffit à faire de leur création un joueur de poker déjà presque parfait.
Des applications dans la santé et la sécurité
"Nous pourrions continuer de l'entraîner et il continuerait de devenir meilleur" ajoute Bowling à The Verge. "Mais nous avons cessé à ce jour, parce que cela n'apporterait rien d'autre que de le perfectionner encore".
Un autre fait intéressant montré par cette étude et que le joueur au bouton a toujours un avantage en jouant en heads-up limit Texas hold'em.
"Nos calculs prouvent de manière formelle l'idée répandue selon laquelle le joueur au bouton a un avantage substantiel" affirme l'étude. Selon Johanson, "Nous pouvons prouver de manière factuelle que l'avantage se chiffre à 88 milliblinds par main ou 0,088 big blind par main".
Au delà de la menace de voir un jour le poker devenir un jeu impossible à battre à cause de robot-joueurs parfaits, les chercheurs pensent que leur étude est important pour aider les gouvernements et les entreprises à mettre en place des systèmes de sécurités "inexploitables".
De plus, cela pourrait aussi aider à les médecins à traiter les patients atteints de diabète. En suivant un processus similaire à celui qui lui a permis de développer un ''jeu parfait'', Cepheus peut déterminer les ''traitements optimaux'' pour un patient dont la situation change – en prenant en compte tous les facteurs d'incertitudes, exactement comme au poker.
Cepheus, le petit frère de Polaris
Si le nom de Bowling ne vous est pas inconnu, c'est qu'il travaillé à Polaris, un bot lancé en 2007 par l'Université d'Alberta dans le but de prouver qu'une machine pouvait battre un être humain au poker.
A l'époque, le robot-joueur avait entamé sa carrière en se voyant infliger une défaite par les joueurs professionnels Phil Laak et Ali Eslami dans le cadre du "Premier championnat de poker Homme Machine ".
Un an plus tard, Bowling, encore lui, annonçait que les développeurs avait pu créer une méthode d'apprentissage dans laquelle Polaris identifie les stratégies poker utilisées par les humains et établit sa propre contre-stratégie. Polaris, capable d'apprendre de ses erreurs, est ressorti vainqueur du deuxième Man-Machine Poker Championship", en s'imposant face à une équipe constituée de Nick Grudzien, Kyle Hendon, Rich McRoberts, Victor Acosta, Mark Newhouse, IJay Palansky et Matt Hawrilenko.
Image par The Verge
Téléchargez PokerStars et créez un nouveau compte avec le code "FRENCHPOKERNEWS" pour pouvoir participer au tournoi gratuit réservé aux joueurs PokerNews avec 1.500€ à gagner chaque mois.
Les dernières infos du poker sur vos médias sociaux : Twitter, Facebook et SoundCloud.