Poker Robots - Polaris 2.0 prend sa revanche contre la Team Stoxpoker

Martin Harris

Partager sur Twitter Partager sur Facebook

12 Jui 2008 4 min à lire

Poker Robots - Polaris 2.0 prend sa revanche contre la Team Stoxpoker 0001

Le logiciel Polaris de l'Université d'Alberta a battu le 6 juillet 2008 sur plusieurs matchs de limit hold'em en tête à tête une équipe de joueurs de poker humains à Las Vegas.

Après sa défaite en juillet 2007 contre les humains au cours du premier championnat de poker Homme Machine à Vancouver au Canada, le groupe de recherche en poker informatisé de l'Université (CPRG) avait une année pour améliorer ses programmes, appelés collectivement Polaris, pour une revanche. Leurs efforts ont été récompensés puisque Polaris 2.0 vient de batter l'équipe de joueurs de poker humains après une série de rencontres de poker limit hold'em.

La compétition a pris place au casino Rio à Las Vegas aux Etats-Unis durant l'expo « Gaming Life » en marge des World Series of Poker, avec un match se tenant chaque jour du 3 au 6 juillet 2008. La Team humaine était composée de plusieurs membres du site consacré à l'apprentissage du poker Stoxpoker. Contrairement à l'année dernière où les humains étaient représentés par deux joueurs, Phil Laak et Ali Eslami, la team Stoxpoker était défendue par notamment Grudzien, Kyle Hendon, Rich McRoberts, Victor Acosta, Mark Newhouse, IJay Palansky et Matt Hawrilenko.

Comme c'était le cas l'été dernier, la compétition consistait en quatre sessions durant lesquelles les humains jouaient simultanément et séparément les mêmes mains de limit holdem « Duplicate » contre les programmes avec des blinds $500/$1,000 et des limites $1,000/$2,000. Selon les règles du Duplicate poker, les cartes distribuées aux humains en une session étaient identiques à celles distribuées aux ordinateurs, et vice versa, avec des cartes communes identiques pour chaque main également. Ce format de jeu limite la chance générée par le tirage : les humains et les Polaris 2.0 devaient faire face aux mêmes cartes et aux mêmes situations.

A la fin de chaque match, le total de chacune des deux sessions de 500 mains jouées simultanément était mis en commun pour déterminer le vainqueur de la session. Si le total représentait moins de 25 petites mises d'écart ($25,000), le match était déclare nul. Une plus grande différence donnait la victoire à l'équipe ayant le total le plus important.

Lors du premier match, ce fut à Nick Grudzien et Kyle Hendon de rencontrer Polaris 2.0. Hendon finit avec un bénéfice $37,000 après les 500 mains, Grudzien termina à moins de $42,000. Comme la différence entre les deux scores étant insuffisante, le match fut déclaré nul.

Les humains remportèrent le second match, grâce aux efforts de Rich McRoberts qui finit à plus de $89,500 contre l'ordinateur. Son partenaire, Victor Acosta, ne fit pas aussi bien en terminant à moins $39,500. Le profit des humains de $50,000 leur assurait la victoire.

Polaris 2.0 réussit cependant un comeback en remportant à la fois le troisième et le quatrième match. Lors du troisième, Mark Newhouse gagna $251,500, c'est à dire de loin la plus grosse victoire d'un humain contre un ordinateur. Il reste que son partenaire IJay Palansky termina à moins $307,500. L'ordinateur conclut donc le match avec un profit de $56,000 pour prendre la victoire. Dans ce match, les cartes avaient clairement avantagé Newhouse d'un côté et l'ordinateur contre Palansky de l'autre.

La quatrième session a vu l'ordinateur remporter ses matchs contre les deux humains en finissant avec un profit de $60,500 face à Mark Hawrilenko et de $29,000 contre Palansky. Ceci donnant à Polaris 2.0 deux victoires, une défaite et un nul.

Selon le professeur Michael Bowling, qui dirigeait les étudiants de l'Université d'Alberta ayant développé le programme Polaris 2.0, des améliorations significatives avaient été apportées depuis l'été dernier et cela rendait les faiblesses du programme plus difficiles à exploiter par les humains.

Bowling expliqua que les informaticiens avaient ajouté "un élément d'apprentissage qui permet à Polaris d'identifier la stratégie standard en cours d'un humain et d'ajuster la sienne. » Autrement dit, l'ordinateur n'emploie plus les mêmes tactiques contre tous les humains. Au contraire, il suit différentes stratégies contre chaque joueur, ce qui le rend plus difficile à jouer par les humains devant affronter des stratégies changeantes durant une session donnée. La comparaison des prises de note sur le jeu de Polaris 2.0 entre deux ou plusieurs sessions est également difficile à interpréter par les humains.

Polaris 2.0 a également appris de ses propres erreurs en employant un algorithme nommé curieusement « regret contrefactuel »grâce auquel il est capable de garder une trace du jeu des humains durant une main qu'il a perdu pour ensuite ajuster son propre jeu lorsque des circonstances similaires surviennent.

Le CPRG indique vouloir développer ses recherches pour aller au delà du tête à tête limit hold'em en abordant des jeux plus compliqués. Le groupe de recherche veut appliquer le résultat de ses recherches en intelligence artificielle aux domaines extérieurs au poker.

Qualifiez-vous gratuitement à partir du 7 juillet pour les tournois EPT de la saison 5 sur PokerStars avec 25$ offerts par PokerNews + 50$ de bonus

Share this article

Martin Harris