Wednesday, 26th March 2025 05:18
Home / GTO basics: che cosa è la Game Theory Optimal nel poker?

Così come il gioco degli scacchi è cresciuto dai primi computer scacchistici, negli ultimi anni la teoria del poker è stata rivoluzionata dalla GTO.

GTO è l’acronimo di “Game Theory Optimal“, traducibile come “teoria dei giochi ottimale“, e fondamentalmente si tratta di uno stile di gioco perfettamente equilibrato, che non permette agli avversari di approfittare dei nostri leak (punti deboli).

Si tratta di un argomento estremamente complesso, basti pensare che i migliori computer moderni non sono ancora capaci di risolvere il gioco del poker, ma cominciare a ragionare in quest’ottica è un ottimo level up per il nostro gioco. Andiamo quindi a capire meglio come funziona la GTO.

Equilibrio di Nash

Per quanto solo negli ultimi anni i nuovi software chiamati “solver” abbiano permesso di approfondire lo studio della Game Theory Optimal, il concetto è tutt’altro che nuovo.

La “Game Theory” è infatti la teoria dei giochi, branca della matematica che ha vissuto un grande sviluppo nel 1900 grazie al contributo di menti come quelle di John Von Neumann e John Nash.

A quest’ultimo dobbiamo la scoperta dell’equilibrio di Nash, che potremmo descrivere come un equilibrio di strategie tra giocatori tale che nessun giocatore abbia alcun incentivo a cambiare.

L’esempio più comune è quello su carta forbici e sasso, poiché è un gioco molto elementare che tutti conoscono.

Immaginiamo di osservare migliaia di partite di un giocatore e notare che la sua tendenza è giocare nel 40% dei casi il sasso, 30% carta e 30% forbici. Possiamo ragionevolmente pensare che (fintanto che questo giocatore non cambia approccio al gioco) vinceremo giocando 100% carta. L’esito delle partite nel lungo termine, infatti, sarà 40% vittorie, 30% pari e 30% perse.

Ogni sbilanciamento di un giocatore, ogni predisposizione per un segno invece di un altro, offre al giocatore avversario un incentivo per cambiare strategia, in modo da approfittare del punto debole. Quindi come bisognerebbe giocare?

L’unico modo possibile è una completa casualità nella scelta: 33% carta, 33% forbici e 33% sasso. L’avversario non potrà approfittare di nessun punto debole, e la sua miglior scelta sarà quella di adottare la stessa strategia. A quel punto nessuno dei due avrà più interesse nel deviare da questa.

Come funziona la GTO

La GTO è l’applicazione nel poker dello stesso concetto espresso qui sopra, in modo ovviamente molto più complesso.

In poche parole, per ogni range di mani, in ogni singola situazione, per ogni specifico board, posizione e tutto il resto, esiste una strategia che non espone il fianco a possibili attacchi dell’avversario.

Come puoi immaginare è molto complicato. È una strategia che tiene conto di tutti i concetti matematici applicabili al poker (pot odds, fold equity, minimum defense frequency…) e cerca il miglior equilibrio tra questi elementi per massimizzare l’EV contro un avversario che a sua volta sta facendo lo stesso.

Sulla carta è esattamente come due giocatori di carta forbici e sasso che giocano in modo bilanciato come spiegato in precedenza, solo che il game tree del poker è infinitamente più complicato.

Con “game tree” si intende la panoramica di tutte le possibilità in cui si può svolgere una mano di poker, che si può immaginare come un albero dalle (quasi) infinite diramazioni. Ogni action è diversa dall’altra e crea un nuovo ramo: il check conduce in una direzione, una bet di 1bb in un’altra, una bet di 5bb in un’altra ancora e così via.

Ad ognuna di queste, poi, si aggiungono tutte le possibili risposte dell’avversario ed eventuali nostre contro-risposte, e poi si considerano tutte le carte che possono uscire nelle street successive e tutte le action possibili…

Insomma, un lavoro davvero lungo e complesso, tanto che nessun essere umano – e attualmente nemmeno i computer, in modo perfetto – può adottare questa strategia.

Perché la GTO è impossibile

La GTO è impossibile perché nel poker esistono troppe situazioni diverse tra loro, così tante che un uomo non può ricordarle tutte né una macchina calcolarle.

Ricordiamo sempre, per capirci, che esistono più modi diversi di mescolare un mazzo di carte di quanti atomi esistano nell’universo.

Attualmente i programmi che arrivano più vicini alla GTO sono i solver, software studiati apposta per questo, che effettuano simulazioni di una situazione al tavolo, seguendo alcune diramazioni del game tree e calcolando l’esito della mano per ognuna di queste.

Poi ripetono il ciclo di simulazioni correggendo le linee di gioco che hanno avuto peggiori risultati, paragonano il valore atteso di tutti i cicli, e continuano a reiterare questo processo fino a raggiungere il punto più vicino all’equilibrio, ovvero: fino a definire una strategia bilanciata che massimizzi l’EV contro un altro giocatore bilanciato.

Di conseguenza serve una non piccola capacità di calcolo della macchina, e si noti che:

1) non tengono in considerazione tutte le linee di gioco, ma solo quelle impostate dall’utente. Per esempio si possono impostare due size di puntata, anche se in realtà ne abbiamo infinite a disposizione, ma più rami si aggiungono al game tree, più lungo sarà il calcolo.

2) non ottengono una strategia direttamente eseguendo calcoli matematici, ma con un sistema che possiamo definire “a tentativi“: centinaia, migliaia (o più) simulazioni che poi vanno a convergere verso un punto di equilibrio, senza per forza arrivare alla perfezione assoluta.

A cosa serve?

Per quanto sia impossibile, studiare la GTO e capirne i principi base è molto utile nel poker, perché permette di avere una visione più ampia del gioco.

Per esempio potresti vedere qualche professionista fare delle mosse che reputi bizzarre, come checkare un buon punto o bluffare in una situazione particolare. Spesso azioni di questo genere servono proprio a bilanciare e proteggere i propri range. Ovvero, migliorare il valore atteso di tutta la nostra strategia, anche al costo di sacrificare valore con qualche mano specifica.

Un esempio semplice: se puntiamo tutte le mani forti, e checkiamo tutte quelle deboli, il nostro avversario punterà sempre ogni volta che faremo check, e giocherà solo il top range quando noi punteremo. Spostando un po’ di valore nel range di check lo disincentiveremo a puntare (potrebbe cadere nella nostra trappola) e spostando un po’ di bluff nel range di bet, gli faremo foldare alcune mani più forti della nostra.

Ovviamente non eseguiremo questa strategia alla perfezione. Va notato che i solver possono proporre soluzioni come “raise nel 47% dei casi con A5 e solo nel 31% dei casi con A5che sono verosimilmente impossibili da ricordare o calcolare. Però capire il perché di questa soluzione ci permette di fare qualcosa di simile in game. Si chiama “semplificazione” ed è l’unico modo per giocare una sorta di GTO.

Ad ogni modo, la maggior parte dei giocatori sembra concordare che giocare GTO (approssimata) non sia la strategia migliore da adottare. Sembra sconvolgente viste le premesse vero?

Il fatto è che quasi tutti i giocatori hanno dei leak, dei punti deboli, degli sbilanciamenti, di cui possiamo approfittare e aumentare di molto i nostri guadagni attesi. Questo si chiama gioco exploitativo, o strategia exploitativa.

Qui entra in gioco il secondo motivo principale del perché studiare la GTO: solo conoscendo le linee di gioco GTO (che per definizione non si possono exploitare) possiamo notare i punti deboli su cui fare leva per vincere.

Un esempio banale, sappiamo che in una certa situazione l’avversario dovrebbe chiamare il 50% delle volte, ma vediamo che in realtà chiama solo il 30%. Allora possiamo puntare molto più spesso per vincere il piatto con un suo fold. Senza sapere quanto “dovrebbe chiamare” non avremmo mai potuto fare questo calcolo.

Inoltre, in assenza di informazioni su un avversario una strategia vicina alla GTO è comunque la più sicura. Quando poi notiamo un leak, possiamo prenderlo di mira.

Posso studiare la GTO senza solver?

La risposta, semplicemente è no. I calcoli sono troppo complessi e ogni situazione migliorabile causa un effetto a catena che si ripercuote su tutte le altre, ed è per questo che i solver effettuano numerosissime simulazioni prima di avere una risposta più o meno precisa.

Pensiamo a un qualunque scenario dove un avversario punta, e noi possiamo chiamare, rilanciare o foldare. Iniziamo facendo fold con il 33% peggiore del nostro range, call con il 33% in mezzo e raise con il 33% migliore. Poi uno di questi filoni, diciamo il call, si rivela avere un valore atteso negativo, allora decidiamo di ridurlo. Ecco che anche i range di fold e di raise andranno ricalcolati da capo, perché saranno più vasti di prima e quindi il loro EV cambierà rispetto al primo calcolo.

Tutto questo, poi, senza contare che alla lunga ci accorgeremo che sarà meglio avere alcune mani forti in trapping e alcune mani deboli in bluff, e dovremo reiterare tutti questi processi fino a scoprire quali siano le migliori mani da mettere in ognuno di questi range.

Insomma, un lavoro impossibile da fare a mente. Finché non metterai le mani su un solver, ti converrà imparare bene la matematica di base del poker e applicarla al tuo meglio!

Articoli correlati

Ultimi Articoli

Impara a giocare a poker con Pokerstars Learn, esercitati con l'app di PokerStars

Prova la nostra classifica gratuita Scholars per mettere alla prova le tue nuove abilità.