Battle de Bots de Poker: OpenAI L'emporte, Grok d'Elon Musk Troisième
Une bataille
de poker entre des bots d’intelligence artificielle, devenue virale dans les mondes du poker et de la tech, s’est conclue après cinq jours d’action automatisée ininterrompue.
Au terme de 3 799 mains de No-Limit Hold’em $10/$20 (Play Money), OpenAI o3 a remporté $36 691 et termine plus gros gagnant de PokerBattle.ai parmi neuf grands modèles de langage (LLM) en lice. L’un des bots les plus connus, Grok (propriété d’Elon Musk), a mené vers la fin du match mais finit finalement troisième avec $33 641 de gains.
Le seul bot à avoir bust lors de ce marathon de poker est Meta LLAMA 4, qui a perdu l’intégralité de sa bankroll de $100 000 après 3 501 mains.
Résultats PokerBattle.ai
| Rank | Player | Total Winnings (Play Money) | Final Bankroll (Play Money) | Hands Played |
|---|---|---|---|---|
| 1 | OpenAI o3 | $36,691 | $136,691 | 3,799 |
| 2 | Claude Sonnet 4.5 | $33,641 | $133,641 | 3,799 |
| 3 | Grok 4 | $28,796 | $128,796 | 3,799 |
| 4 | DeepSeek R1 | $18,416 | $118,416 | 3,799 |
| 5 | Gemini 2.5 Pro | $14,655 | $114,655 | 3,799 |
| 6 | Mistral Magistral | $3,281 | $103,281 | 3,799 |
| 7 | Kimi K2 | -$14,370 | $86,030 | 3,799 |
| 8 | Z.AI GLM 4.6 | -$21,510 | $78,490 | 3,799 |
| 9 | Meta LLAMA 4 | -$100,000 | $0 | 3,501 |
Différents styles de jeu
La bataille de bots de poker a été imaginée par Max Pavlov, 33 ans, qui a indiqué à PokerNews que les modèles, capables de prendre des notes et de s’adapter à leurs adversaires, avaient été entraînés à partir de « livres de poker, articles de blog » et d’autres ressources d’étude.
Le plus gros pot de la journée est revenu à OpenAI o3 dans un pot 4-bet où il détenait des As contre les Dames servies de Gemini 2.5 Pro, lequel a payé un 4-bet puis des mises au flop et à la turn sur le board 9♦8♦7♣4♥, envoyant $10 795 en argent fictif à OpenAI o3.
Gemini 2.5 Pro a expliqué son raisonnement pour le call à la turn. « C’est une situation délicate, mais je pense que payer est le bon jeu. La ligne de mon adversaire est extrêmement polarisée. Il représente une main monstre (AA/KK) ou un bluff complet (comme AK). Étant donné son 4-bet agressif préflop et la petite mise au flop, ce shove turn ressemble à un move pour me faire folder une overpaire. Les cotes du pot sont convaincantes (je dois avoir raison environ 37,5 % du temps). Contre une range AA, KK et AK, ma paire de Dames a suffisamment d’équité pour justifier un call. Folder ici me semblerait trop exploitable face à un adversaire compétent et agressif. C’est une position que je dois prendre. »
Grok 4, qui est en discussion pour affronter la légende Phil Galfond en heads-up high stakes, détenait l’avantage à moins de quatre heures de la fin de la bataille mais n’a pas réussi à le conserver. Le Claude Sonnet 4.5 d’Anthropic s’en est le mieux tiré après le vainqueur, avec $33 641 de gains.
Bien que Pavlov ait mis en garde contre une lecture trop orientée « résultats » sur un si petit échantillon de mains, il apparaît clairement que le style de jeu a pesé dans la performance catastrophique de Meta LLAMA 4. Ce bot, seul à avoir perdu l’intégralité de sa bankroll de $100 000, affichait un VPIP supérieur à 60 %, soit près de trois fois celui de ses concurrents.
Pour consulter les historiques de mains du match, rendez-vous sur pokerbattle.ai/hand-history.




