La Théorie des jeux appliquée au Poker
Cet article poursuit notre exploration de la Théorie des jeux. Si vous n'avez pas lu la première partie, nous vous recommandons de commencer par là, sans quoi vous ne saisirez peut-être pas entièrement cet seconde partie. En partant de cas fictifs, nous irons aux applications concrètes.
Les exemple de cet article sont tirés de The Mathematics of Poker par Bill Chen et Jerrod Ankenman et The Theory of Poker par David Sklansky. Nous essayons de présenter les idées exposées dans ces ouvrages de façon claires et accessibles à tout le monde. Si vous désirez avoir plus de détails, ces deux livres sont de bonnes sources sur la Théorie des jeux appliquée au poker.
La Théorie des jeux et le "demi-street" poker
Nous allons jouer au poker avec une "demi-street". Qu'est-ce que c'est ? Il s'agit d'un jeu s'inspirant du poker mais simplifié pour pouvoir l'étudier plus facilement. Les règles sont les suivantes :
• Le Joueur 1 (appelé X) check in the dark (sans regarder ses cartes).
• Le Joueur 2 (appelé Y) a le choix entre checker ou miser un certain montant défini à l'avance.
• Si Y mise, X peut décider de suivre et on voit alors un showdown. X a aussi le choix de fold, mais ne peut pas relancer.
• Si Y check, les deux joueurs voient le showdown.
Pour illustrer cela :
Dans ce jeu, la main du Joueur Y est tirée aléatoirement, 50% de ses mains vont battre la main du Joueur X et 50% vont perdre contre le Joueur X. Ce qui apparaît aussitôt, c'est que le Joueur Y ne peut pas avoir une EV négative dans ce jeu car il a toujours l'option de checker après X, ceci lui permet d'avoir une EV=0 à tout moment. Si les deux joueurs checkent toujours leur main, ils gagneront tous deux 50% du temps. X n'a qu'une seule main qui est connue d'Y, ce dernier a donc un avantage informationnel.
X et Y n'ont qu'une seule décision à prendre. Y doit trouver une range (sélection de mains) avec laquelle miser et X doit trouver la range avec laquelle il va payer une mise d'Y. Puisque la range du joueur X n'est constituée que d'une seule main, il doit en réalité trouver la fréquence à laquelle il va suivre une mise faite par Y. Y peut jouer à ce jeu avec une stratégie pure (c'est-à-dire, qu'il peut choisir une option 100% du temps). Il value bet toujours les nuts et check toujours les mauvaises mains. X peut exploiter cette stratégie en choisissant de toujours fold quand Y mise car X sait qu'Y mise uniquement ses bonnes mains. Si X call une mise, c'est uniquement pour perdre.
Si X joue ainsi, alors Y peut changer sa stratégie en misant toutes ses bonnes mains et en bluffant avec les mauvaises. Si Y se met à jouer ainsi, alors X peut commencer à suivre 100% du temps, ce qui aura pour conséquence de ramener Y vers sa stratégie initiale (miser les nuts et checker les mauvaises mains). Vous constatez qu'ici nous avons une récurrence de stratégies pures qui s'alternent. Ce qui signifie que la stratégie optimale pour ce jeu n'est pas une stratégie pure, mais une "stratégie balancée" (mixed strategy), à savoir une stratégie où l'on choisis différentes options un certain pourcentage de fois.
Définir une stratégie balancée (mixed strategy)
Dans ce jeu, il y a deux choix stratégiques à faire :
Pour X : à quelle fréquence est-il censé suivre ?
Pour Y : à quelle fréquence doit-il bluffer ?
Y doit toujours miser avec les nuts, car cette option est clairement plus profitable que le check. X devra call un certain pourcentage de fois (C%) et Y devra bluffer un certain pourcentage de fois (B%). Quand nous connaîtrons les valeurs de C et B, nous aurons notre réponse.
Le Joueur X
Commençons par le Jour X. X joue de façon optimale quand Y est indifférent entre le fait de checker ou de bluffer, cela veut dire : bluffer ou checker a la même EV pour le joueur Y. Si Y bluff avec succès (forçant X à folder), il gagnera P-mises (la taille du Pot) et perdra une mise si X décide de call. Si C est la fréquence de call, alors 1-C est la fréquence de fold. Si X joue de façon optimale, alors Y est indifférent au fait de checker ou de bluffer. Ainsi :
(Taille du Pot)(fréquence de fold d'X) = (Mise en bluff)(fréquence de call d'X)
(P)(1-C) = (1)(C)
P – PC = C
P = C + PC
P = C(1+P)
C = P/(1+P)
Comme nous le voyons, plus le pot est gros, plus X devra décider de call souvent. Cela nous ramène au principe des Pot Odds (côtes du pot) : Plus il y d'argent dans le pot, plus X doit caller souvent pour contrer la tendance au bluff d'Y.
Le Joueur Y
D'un autre côté, nous avons la stratégie du Joueur Y. Y doit bluffer assez souvent que le Joueur X soit indifférent au fait de call ou de fold. Si X call, il perd une mise quand Y value bet et X gagne P+1 (la taille du pot plus une mise) quand Y bluff. (Souvenez-vous que B est la fréquence de bluff).
1 = B(P+1)
B = 1/(P+1)
La valeur de 1/(P+1) est capitale pour l'analyse du poker. Elle est si importante que nous l'appellerons A:
A = 1/(P+1).
A implique deux choses pour ce jeu. D'abord, X doit call assez souvent pour rendre Y indifférent au fait de checker ou de bluffer ses mains faibles. La fréquence de call d'X est égale à P/(P+1), qui est égale à 1-A. Pour ceux qui ne comprendraient pas pourquoi P/(P+1)=1-A, voici le détail du calcul :
Si A = 1/(P+1) alors :
1-A = 1 – 1/(P+1)
1-A = (P+1)/(P+1) – 1/(P+1)
1-A = (P+1-1)/(P+1)
1-A = P/(P+1)
1-A est la fréquence de call du Joueur X et A est la fréquence de fold d'X s'il est confronté à une mise du Joueur Y. De plus, comme vu précédemment, Y va bluffer 1/(P+1) ou A% du temps. Nous pouvons donc conclure que la stratégie optimale pour ce jeu est la suivante : Y mise toutes ses nuts et bluffs A% du temps ses mains faibles (ou nous pouvons aussi dire qu'Y bluff A/2 de l'ensemble de ses mains dans la mesure où son ratio de mains perdantes-gagnantes est de 50-50) et X call avec 1-A de l'ensemble de ses mains.
Exemples de fréquences de bluff selon la taille du pot
Voici un exemple. Imaginons que P=3. Cela signifie que :
A = 1/(3+1)
A = 0.25 et donc : 1-A = 0.75
Nous voyons alors que le Joueur Y bluff 25% du temps. Aussi, il continue de miser ses nuts (50% du temps) et miser 25% du temps où il a une main médiocre, ce qui est égal à : 0.25 x 0.5 = 0.125 = 12.5 % du temps (et nous remarquons aussi que A/2 est égal à 0.125). De plus, le joueur X call 75% du temps.
Admettons maintenant que P = 4.
A = 1/(4+1)
A = 0.20 et donc: 1-A = 0.80
Dans cette situation, Y doit miser 20% du temps en bluff. Il mise toujours les nuts (50% du temps) et mise en bluff 20% du temps quand il a une main perdante, soit : 0.20 x 0.5 = 0.10 = 10 % du temps (et A/2 est aussi égal à 0.10). En outre, X va call 80% du temps.
Observez que la fréquence de bluff d'Y diminue alors que le pot devient plus gros. Cela est contre-intuitif, on pense souvent que bluffer dans un gros pot résulte en un plus gros gain. Mais un principe important pour jouer une stratégie optimale est que dans une partie de poker optimale, bluffer n'est pas profitable. La combinaison de bluffs/value bets a été inventée pour s'assurer que la stratégie optimale conserve sa valeur indépendamment des réactions de l'adversaire.
La théorie des jeux appliquée au Texas Hold'em
Abordons maintenant une partie de poker réel où nous utilisons la théorie des jeux pour décider de la fréquence à laquelle nous allons bluffer. Nous jouons au No Limit Texas Hold'em en tête-à-tête. Nous attendons après la river et cherchons à savoir à quelle fréquence nous pouvons bluffer dans cette situation.
Gardez à l'esprit que l'on n'a pas nécessairement besoin de la théorie des jeux pour trouver la réponse. Face à un joueur qui call très souvent, nous n'allons pas bluffer. Inversement, face à un joueur qui fold trop, nous allons bluffer souvent. La théorie des jeux est utile si vous ne connaissez pas bien votre adversaire et pensez qu'il est meilleur que vous. Nous voulons alors être certain qu'il ne nous exploite pas.
Supposons que nous ayons 20% de chance de gagner à la river (par exemple avec un tirage couleur). Il y a 100$ dans le pot et une mise de 50$ semble appropriée (60$ seraient peut-être mieux, mais nous préférons garder les pot odds simples). Notre adversaire se voit offrir une côte du pot de 150:50 ou 3:1. Pour trouver la fréquence de bluff, nous devons nous assurer que nos "bluff odds" sont égales aux pot odds de notre adversaire. Par "bluff odds" nous entendons la probabilité que nous soyons en train de bluffer au moment où l'on mise.
Dans la mesure où la côte du pot adverse est de 3:1, notre fréquence de bluff doit aussi être de 3:1, soit 25%. Quand nous misons sur la river, nous aurons donc la meilleure main 75% du temps et 25% du temps, nous miserons pour bluffer. Miser 75% du temps avec la meilleure main river revient à miser les 20% du temps où nous touchons la river qui nous donne les nuts. Les autres 25% correspondent à 6,66% (soit 20% divisé par 3, du fait de la côte de 3:1). Dès lors sur la river, nous allons miser 20% du temps avec la meilleure main, bluffer 6,66% du temps et checker 73.34% du temps.
Comment appliquer cela dans la pratique ? Nous pouvons simplement choisir de toujours miser nos 9 outs (pour la couleur) pour value et miser 3 "bluff outs". Assurez vous toutefois de représenter quelque chose avec ces "bluff outs", sinon votre plan fera l'effet d'un pétard mouillé. Les 3 outs correspond aux 6,66% de fréquence de bluff (3 outs divisé par 46 cartes inconnues = 0,065). Ainsi, sur la river nous misons quand nous touchons l'un de nos 9 outs pour les nuts et l'un de nos 3 "bluff outs" choisis au préalable.
Si notre adversaire doit payer une de nos mises en ayant une côte de 3:1, il saura que nous avons la meilleure main 75% du temps et que nous bluffons 25% du temps. Ses chances de gagner sont donc de 25%. Lorsqu'il call, son EV = (0.25)($150) + (0.75)($-50) = $37.5 - $37.5 = 0$ et son EV pour fold est aussi de 0$.
Ainsi, en utilisant la théorie des jeux, nous sommes certains de ne pas être exploité par un adversaire inconnu et/ou meilleur que nous. Il suffit de suivre ce processus :
1) Décidez de la taille de votre mise et regardez la côte que vous offrez à votre adversaire avec cette mise.
2) Assurez-vous que vos "bluff odds" sont égales aux pot odds offertes à votre adversaire. Dit autrement, si vous misez sur la river, les pots odds offertes à votre adversaire doivent être égales à la probabilité que vous bluffiez.
Juste un autre exemple. Le pot est de 500$ et vous désirez miser 400$. Votre adversaire a une côte du pot de 2,25:1 ou 30,77%. Si vous décidez de miser dans cette situation, vous devez avoir la meilleure main 69,23% du temps et bluffer 30,77%. De cette manière, votre adversaire ne pourra pas vous exploiter.
10.000€ de freeroll chaque jour sur Bwin.fr
Bwin.fr propose 31 tournois freerolls quotidiens dotés de prize pool garantis allant de 150€ à 1.000€ pour une dotation journalière de 10.000€. Ouvrez votre compte aujourd'hui et bénéficiez d'un bonus de 500$ lors de votre premier dépôt.