Kipik Poker : comprendre les statistiques de son tracker
Cela fait longtemps que nous n'avions pas fait un peu de maths dans cette chronique, je suis sûr que cela vous manquait. Je vais donc profiter d’un petit cas de conscience qui m’est arrivé cette semaine : jusqu’à quel point peut-on faire confiance aux données qu’affiche notre tracker ?
Rappel pour les néophytes : les trackers sont des logiciels d'aide à la décision qui analysent divers paramètres de notre jeu et de celui de nos adversaires, affichant en temps réel les statistiques tirés des mains observées.
Infos ou intox : décodage des trackers
Quand il s’agit d’estimer le pourcentage de mains jouées par un joueur (le fameux VPIP, Voluntarily Put Into Play, qui correspond au pourcentage de mains jouées volontairement par un joueur, donc sans compter les BB où personne n’a relancé), les données convergent très rapidement vers un nombre qui sera relativement correct.
Et, ce, d’autant plus que la valeur du VPIP sera «hors norme». Pas de secret, si vous avez joué ne serait-ce que dix mains contre un joueur qui affiche un VPIP de 80% (il a donc volontairement joué 8 mains sur 10), vous savez que vous êtes en face d’un bon client. Peu importe que son VPIP soit au final de seulement 48 ou 60 ou 87%, vous en savez déjà assez après dix mains pour en tirer la conclusion qui s’impose : ce joueur joue extrêmement loose (large).
Dans ce genre de situation, la qualité de l’information fournie par le tracker n’a pas grand intérêt. Que son VPIP soit de 50, 65 ou 80% ne changera pas grand-chose à la façon dont on abordera ce (bon) client.
Malheureusement, ce genre d’approximation est rarement acceptable. Je ne compte plus le nombre de joueurs que j’ai par exemple catalogués «serrure», sur parfois plusieurs centaines de mains, avant de finalement me rendre compte qu’ils ne l’étaient pas du tout (serrés). On traverse tous des passes sans jeu, qui peuvent durer très longtemps. Ou, inversement, de gros rush de cartes.
Et puis, parfois, c’est aussi la dynamique de la table qui va contraindre un joueur à resserrer son jeu (par exemple quand il a des joueurs très larges derrière lui). Ou, inversement, lui permettre de jouer beaucoup plus large que son «standard». Sans tenir compte de facteurs difficiles à prendre en compte : un joueur peut parfois jouer 16 tables et d’autres seulement 4; il peut être en tilt, être plus ou moins concentré…
Autant d’informations que notre tracker n’a aucun moyen de prendre en compte. Celui-ci ne sait que traiter les données brutes (quantitatif), il n’est pas (encore ?) capable de les qualifier selon le contexte.
Les trackers ne connaissent pas l’erreur…
Une des erreurs les plus fréquentes que commettent les joueurs, et je plaide très souvent coupable sur celle-là, est d’accorder une confiance aveugle aux statistiques que leur donne leur tracker.
Or, ces statistiques n’ont parfois aucune valeur. Pire encore, elles peuvent même être totalement erronées.
Il est crucial de comprendre comment interpréter ces statistiques par rapport à l’échantillon disponible afin de savoir quel crédit accorder à notre tracker. C’est là qu’interviennent deux notions fondamentales aux statisticiens : l’intervalle de confiance et la marge d’erreur.
Je ne vais pas me lancer dans un cours de statistiques, vous trouverez de très bons didacticiels en ligne, ce qui nous intéresse est le résultat. Et comment l’appliquer aux données fournies par notre tracker.
L’idée derrière la notion de marge d’erreur est que la qualité d’une statistique va dépendre de la taille de l’échantillon analysé. Rien de surprenant sur le principe, c’est la mise en pratique qui étonne souvent.
Prenons un exemple concret :
On relance au Bouton, vilain nous surelance en big blind et notre tracker nous informe qu’il a surelancé 7% du temps. Si j’en crois mon tracker, mon adversaire a donc tendance à surelancer un peu large, pas seulement pour valorisation. Il a également jeté sa main la seule fois où il s’est fait 4b (sur-surelancé).
Tel quel, décider de 4b A♣J♦ (ou au moins de payer son 3b) sur l’assomption qu’il surelance un poil large, semble réaliste.
Néanmoins, j’ai une autre information à prendre en compte : j’ai joué 122 mains avec lui.
Pour un joueur de «live», 122 mains représenteraient déjà un échantillon important. Après tout, vous auriez déjà joué au moins 4h avec lui et vous auriez une assez bonne «vision» de son jeu. Malheureusement, online, nous n’avons aucune information physique (comment se tient-il, s’il se sent confiant, la façon dont il misé etc etc etc) pour nous aider. Et vu qu’on joue presque tous plusieurs tables en même temps, il est plus probable qu’on n’a rien remarqué de particulier sur lui en seulement 122 mains. Et on ne saura jamais s’il est tout à coup en tilt après avoir pris un énorme badbeat sur une des cinq autres tables qu’il joue.
Il faut donc en revenir aux bonnes vieilles statistiques : sur 122 mains, il a 3b 7% du temps.
La dernière génération de trackers détaille un peu plus l’information disponible. Chez ce joueur, le 7% de 3b en 122 mains correspond en réalité à 7% des 43 occurrences où il lui était possible de 3b. En clair : la statistique de 3b exige qu’on puisse surelancer et, donc, que quelqu’un ait déjà relancé avant nous (ce n’est donc déjà pas possible quand on est premier de parole). Sur 122 mains jouées, cette situation ne s’est produite que 43 fois.
7% de 43 fois = 3. Vilain a donc surelancé 3 fois sur les 43 situations où cela lui était possible.
On sent bien tout de suite que le 7%, qui nous paraissait un peu large, ne l’est plus réellement quand on le traduit en « 3 fois sur 43 possibles ».
La marge d’erreur en pratique
Passons outre le cours de statistiques et balançons la formule. Il en existe une assez simple qui permet de déterminer la marge d’erreur d’une statistique en fonction de la taille de l’échantillon (avec un intervalle de confiance de 95%, je vous laisse creuser la chose si vous souhaitez en savoir plus, wiki et autres sont toujours vos amis) :
Marge d’erreur, avec un intervalle de confiance de 95% ≈ 0.98/√n
Où n est la taille de notre échantillon (ici, 43)
Le nombre donné par notre tracker sera en réalité compris entre ce nombre moins la marge d’erreur et ce nombre plus la marge d’erreur.
0.98/√n avec n=43 = 0.98/6.55 = 0.15
Sur un échantillon de 43 occurrences, la marge d’erreur est d’environ 15%. Et le joli 7% qu’affiche notre tracker est à lire “à 95% de certitude quelque part entre 7-15% et 7+15% (donc, entre 0% et 22%)”.
Autrement dit, notre tracker ne nous dit rien. Ou, plus précisément, rien de valable. Rien de réellement intéressant. Rien qui nous permette de prendre une décision en toute confiance.
Comment évolue la marge d’erreur dans le temps ?
Sur une base de 7% de 3bet, avec un intervalle de confiance de 95%, sur un échantillon de :
Échantillon | Marge d'erreur | 3b % réel | |
10 | 31% | 0%-38% | |
20 | 22% | 0%-29% | |
30 | 18% | 0%-25% | |
50 | 14% | 0%-21% | |
100 | 10% | 0%-17% | |
250 | 6% | 1%-13% | |
1000 | 3% | 4%-10% |
Même un échantillon de 250 occurrences ne nous permet pas réellement d’avoir une bonne idée de la fréquence de 3b. A 95% de certitude quelque part entre 1% et 13%...
Sur un échantillon de 1000 occurrences, où ce joueur aurait donc 3bet 70 fois, l’intervalle de 95% nous donne une range entre 4 et 10%. Il est encore très difficile de déterminer si ce joueur 3b seulement pour valoriser ou s’il est capable d’ouvrir son range.
Pour l’anecdote, il faut environ un échantillon de 10000 situations pour obtenir une marge d’erreur de moins de 1% avec 95% de confiance et, donc, mettre notre adversaire sur une range de 3b entre 6 et 8%.
Évidemment, il est absurde de vouloir faire ces calculs pendant une main. La seule chose qu’il faut en retenir, c’est que la marge d’erreur se réduit extrêmement lentement. Et que les nombres affichés par notre tracker sont à prendre avec énormément de prudence. Mon tracker me dit que ce joueur a 3bet 7% du temps mais il peut tout aussi bien sur-relancer seulement AA ou une main sur cinq.
En particulier quand il s’agit de statistique complexe.
Attention aux statistiques complexes
Une statistique simple comme le VPIP va converger assez rapidement vers quelque chose de réaliste. Sur 100 mains jouées, la marge d’erreur sera de 10% maximum. Sur 250, elle ne sera plus que de 6%. Sur mille mains, un VPIP affiché de 22% sera extrêmement réaliste.
Si, maintenant, je m’intéresse au VPIP par position (par exemple combien de mains joue-t-il depuis le Cutoff), alors l’échantillon nécessaire pour avoir la même précision sera 6 fois plus grand (si je joue en 6-max, 9 fois plus grand en table de 9).
Certaines statistiques vont mettre extrêmement longtemps avant d’être significatives. Prenons notre exemple et regardons sa statistique de «fold to 4bet» (autrement dit, combien de fois ce joueur a surelancé et s’est couché quand on lui est revenu dessus). Sur 122 mains jouées, il a eu la possibilité de 3bet 43 fois, a réellement 3bet 3 fois et s’est fait 4bet 1 fois. Le tracker affiche donc 100% de «fold to 4bet». Situation qui n’est arrivée qu’une fois sur 122 mains et signifie, en réalité, que notre adversaire va se coucher sur un 4bet entre 2% et 100% du temps. Notre tracker serait aveugle et muet, ce serait pareil…
Autant dire qu’on travaillera rarement avec une faible marge d’erreur à part pour des statistiques de base comme VPIP et PFR (et encore, cela ne tiendra pas compte de la possibilité que le style du joueur ait évolué le temps qu’on recueille un tel échantillon, ce qui est très probable).
On a tous déjà hurlé devant notre écran quand, alors qu’on décide finalement de 4b à tapis avec une main moyenne un joueur qui sur-relance en permanence, celui retourne une premium. Qu’on utilise un tracker ou simplement notre cerveau, le fait est qu’on va s’appuyer sur un échantillon faible où un joueur semble sortir des normes. Or, rien ne le prouve.
Tracker or not tracker : statistiques ou instinct
La taille même de l’échantillon sur lequel on s’appuie pour prendre notre décision (et 4bet) ne permet pas, en réalité, de prendre une décision raisonnée. Qu’un joueur 3bet quatre des vingt dernières mains jouées ne signifie absolument pas qu’il 3bet 20% du temps. C’est possible. Mais la marge d’erreur sur un aussi faible échantillon est tellement importante qu’elle ne nous permet, en fait, de tirer aucune conclusion réaliste.
Si vous jouez sans tracker, vous allez appuyer votre jeu sur votre perception des choses. Sur la dynamique perçue. Vous allez parfois/souvent vous tromper mais ce n’est pas le plus important. Le risque avec un tracker est de s’appuyer sur les statistiques données sans comprendre réellement leur valeur. Les nombres affichés prennent une valeur réelle, presque palpable, qu’ils ne méritent pas le plus souvent.
Un bon exercice pour vous en convaincre : jouez une table en décidant de ne sur-relancer que AK et QQ ou mieux. Et observez combien de temps votre propre statistique de 3b va mettre pour afficher 2.6%. Mon pari est que vous serez parti vous coucher bien avant…
Stratégie poker sur le Forum PokerNews
Le Forum PokerNews France est un lieu d'échange avec les autres joueurs de poker de tous niveaux. Posez vos question sur la section Stratégie Cash Game ou Stratégie MTT et soumettez vos mains au meilleurs joueurs online du .fr.
Inscrivez-vous sur le Forum PokerNews, c'est rapide, c'est gratuit et ça peut rapporter gros !