GTO戦略 vs エクスプロイト戦略|GTOウィザードYouTube動画参照

GTOウィザードといえば、GTOを学ぶための解析ソフトです。

(ここからGTOを登録すると10%割引になります)

GTOウィザードのYouTube動画はすべて英語なので、ブログで翻訳してそのまとめを紹介していきます。
(あくまでも個人のまとめであり、わかりやすさを重視してまとめています。そのままの内容を理解したい方は動画をどうぞ)

今回紹介するのは、

[GTO vs Exploitative Poker]

「GTO戦略 vs エクスプロイト戦略」

参考にした動画はこちら。

講義の内容

  • GTOとエクスプロイトの関係
  • ネメシス戦略とは?
  • GTO戦略とエクスプロイトにまつわる誤解
  • トイゲームの具体例
  • GTOとエクスプロイトの関係を実践的具体例からつかむ
この動画は今まで見てきた中で1番すごい動画だと思った!
ポーカーが考えられるようになるって、こういうことなんだって思ったよ
目次

GTO戦略とエクスプロイト戦略の関係

「GTO対エクスプロイト」というように、多くの人は敵対的、2元的というように対立しているイメージを持っています。

しかし、実際はまったく違います。

2つのスタイルは相互に補完しあっています。

一方がもう一方なしには見ることができません。

エクスプロイト戦略をとるプレイヤーとGTO戦略をとるプレイヤーはお互いを理解していないとそのプレイができないのです。

えっ!対立関係にあると思ってたけど違う!
2つの戦略を定義します。
  • GTO戦略⇨
    ・弱点を最小限にしたバランスの取れたスタイル
    ・ナッシュ均衡の原理に従っている
    ・最大化された固定戦略
  • エクスプロイト戦略⇨
    ・対戦相手のバランスの取れていない部分をついたスタイル
    動的な戦略であり、対戦相手にごとに適応する
    ・カウンターエクスプロイトにあう危険性がある

GTOがエクスプロイトされないようにデザインされている意味は、GTO戦略に対して最もエクスプロイトする方法がGTO戦略だという意味です。

エクスプロイト戦略は対戦相手のバランスがとれていない部分をつきます。

しかし、エクスプロイト戦略を実行しているとカウンターエクスプロイトもされてしまいます。

エクスプロイトを実行する時点で、バランスのとれていない部分がでてくるからです。

うーん、定義からみてもまだ2つの関係性がわかりにくい!
また、エクスプロイト戦略はリスクも多くなるのですが、その分の見返りも大きくなります。
さらに関係性を見ていきましょう。

GTO戦略とエクスプロイト戦略は「同じコインの裏と表」の関係

GTO戦略とエクスプロイト戦略は対立しているように見えますが、実は同じコインの裏と表のようなものです。

GTOはエクスプロイトを作り出したり、エクスプロイトをどうプレイすればいいのか方法を教えてくれるからです

GTOがエクスプロイトを教えてくれる!?

エクスプロイトはGTOがベースラインになっていて、GTOのベースライン上でそのバランスの取れていない部分を搾取します。

あなたはどちらか一方の戦略を理解するだけでは、どちらの戦略も決して「本当に理解する」ことができないのです。

エクスプロイト原理の基礎は、なぜGTO戦略(ソルバー)はこのように働くのかを理解すること。

GTO戦略からバランスがとれていないということを知って、エクスプロイト戦略が作り出されます。

例えば、あなたがGTO戦略の基礎を知っていると、対戦相手がバリューヘビーやブラフが多いなど、正しいバリュー量から間違いがわかるようになります。

あなたの対戦相手がそこから外れていると理解するには、共通した基礎が必要です。

基礎があるからエクスプロイトをプレイするラインがわかります。

うーん、GTOが基礎ってことはわかるけど、じゃあエクスプロイトはどうGTOに関わるのかな…

GTO戦略はどのようにつくられたのか

GTO戦略はどのようにつくられたのかを見ていきます。

2つのボット(プログラム)、AとBがあります。

AとBはお互い、ランダムな戦略で勝負を始めます。

  1. AはBに勝つために戦略を変えて、Bを搾取(エクスプロイト)します。
  2. BはAに勝つために新たな戦略をとり、Aを搾取します。
  3. またAは新しい戦略に変えて、Bを搾取します。
  4. Bはまた戦略を変えて、Aを搾取します。

この1~4を繰り返して行って、ナッシュ均衡(戦略を動かさない方が利益的)になるまで繰り返します。

エクスプロイト戦略を繰り返して頂点にたどり着いた結果がGTO戦略です。

エクスプロイトをしようとして戦略を変えると利益が減ってしまうので、お互いが戦略を変えないスポットが均衡(GTO戦略)です。

そっか、だからエクスプロイトは動的(相手によって変わる)で、GTOは固定的(たどり着いた均衡)なんだね!
次に、なぜGTO戦略はそのような行動を示すのか。
この質問に答えるためにエクスプロイト戦略の原理をたどっていきましょう。

GTO戦略はエクスプロイト戦略の原理から成り立っている

GTO戦略はエクスプロイトの原理から成り立っています。

ナッシュ均衡の状態とは、「一方的に戦略を変更して得をするプレイヤーはいない」状態。

別の言葉で言えば、みんながGTOをプレイしていれば利益を得ることができない状態です。

この状態をさらに考えるために、この問題を考えてみましょう。

「なぜソルバーはXを実行するの?」

(ソルバー⇨最適な戦略を計算してくれるポーカーツール)

どうやってソルバーは計算してるんだろう…

答え

なぜならXを実行しなかったなら、対戦相手はそれに対してYの行動をとることによってエクスプロイトできるから
つまり、Xを実行すると相手はエクスプロイトできなくなっちゃうんだね!
  • Xを実行⇨相手はエクスプロイトできなくなる。
  • Xを実行しない⇨相手はYの行動をとることでエクスプロイトできる。

ソルバーはエクスプロイトされないバランスの取れた「最適な戦略」を導き出します。

プリフロップから「最適な戦略」の具体例をみる

とても単純な具体例を出してみましょう。

(6max、100bb、simple、500nl)
SB「87o」オープン。

頻度でオープンがあるのでSBからオープンするハンド「87o」のEV(期待値)は0です。

なぜあなたは0EVのハンドをオープンするのですか?

図でそう示されてたから…としか思ってなかった…
答え
0EVハンドであっても、GTO戦略通りにオープンする方が搾取されないから。
EVに従って、もしSBがシンプルにそれらの0EVハンドをフォールドするとします。
例えば、「K8o、78o、A4o、J3s、53s」をフォールド。
これらをフォールドして「タイト」にプレイするとどうなるかみてみます。
すると、BBはその戦略にアジャストして、BBも少しタイトにプレイします。
(ここでは特に解析してそのようなことを言っているわけではありません。)

BBがタイトになることは、SBのコストになるという結果がでます。

  • SBがGTO戦略から外れる⇨BBはエクスプロイトしてくる。
  • SBがGTO戦略どおりにプレイする⇨BBはGTO通りにプレイするのが一番利益的

BBがタイトになった場合、SBはレンジの強い方のハンドでバリューを稼げなくなります。

反対に、元通り0EVのハンドを頻度でオープンすると、BBは広いレンジでコールするので、それはSBのバリューになってきます

弱いハンドにコールしてもらえると得な気がするし、フォールドしてくれた方が得な気もする…
ちょうどいいバランスがGTO!

なぜあなたがGTOに従っているのかというと、それを外れると対戦相手はそれにアジャストして利益を上げるからです。

0EVのハンドをオープンしないというバランスの取れていない行動をした結果、BBはそれにアジャストして利益を得ます。

もしSBがGTO戦略通りにオープンしていたら、BBはエクスプロイトできない!

エクスプロイトはベースラインなしでは見えない

エクスプロイト戦略は正しいベースラインなしでは見えてきません。

バリューヘビー、ブラフ過多、というのは正しいバリュー量やブラフ量を知っていないとわからないからです。

多くの人はGTO戦略に慣れていません。

感覚に頼ってプレイしています。

実際にそれらの人々は今打っている環境(プレイヤープール)でブラフが多い、バリューが多いという判断をしていて、それは実際には正しいエクスプロイトにはつながりません。

主観的な答え(データによらない感覚での答え)は、あなたがどのようにエクスプロイト戦略を実践したらいいのかを教えてくれないのです。

今いる環境のみの答え…確かに、プレイする環境を変えると急に勝てなくなったりする…
基礎のベースラインを身につけるとエクスプロイト戦略をミスしないだけでなく、対戦相手がミスをしているたくさんのスポットを見つけ出すことができます。
では、正しいエクスプロイトはどのように身につけたらよいのでしょうか。

エクスプロイト戦略の正しいやり方

正しいエクスプロイトの手順はこちら。

エクスプロイトの手順

  1. ベースラインから相手のプレイがどのように離れているかを認識する
    (あなたの読みが信頼におけるか評価する【間違っている可能性がある】)
  2. 自分自身に相手のプレイがなぜミスなのかを問う
  3. 相手のミスが増える方法を明らかにする

まずは正しいベースラインを知ります。

もしベースラインを知らないならば、あなたは「ガン・ホー(団結行動を呼びかける掛け声)」というようにわずかな直観大量のリスクとともにそれを実行することになります。

「いくぞー!」とか、「突撃だー!」みたいな感じで、みんなで渡れば怖くない的な…
直観に頼っていないか、そのベースラインには根拠があるのかどうかを評価してください。

エクスプロイトを正しく実行する前に、あなたは自身のリーディングを信頼のおけるものにしなければいけません。

いや、待てよ…これは赤信号だ…

なぜそのプレイはミスなのか、どのくらいベースラインから外れているのかを自分に聞いてください。

その後で、その相手のミスをどのくらい増やせるのかを明らかにしていきましょう。

ミスを増やす方法ってどういう意味だろう?

ミスを増加させる具体例

「ミスを増加させる」ということを具体例から説明していきます。
(これはとてもシンプル化させた例題です。)

(スピン&GO 25-25-25)(3人で対決をするポーカー)

  • BTNオープン、BBコール。
  • フロップ「A♠9♥9♦」
    BTN0.22xベット、BBコール。
  • ターン「5♠」
    BTN1xベット(ポットベット)、BBコール。
  • リバー「2♣」
    BTNオールイン(0.79xベット)

このとき、BTNのオールインに対してBBはどのような行動をとればいいのでしょうか?

ターンのBTNの大きいベット(ポットベット)にはトリップスより上の役やトップペアのバリューやブラフが想定されます。

ここでSBがエクスプロイトするベースラインには、BTNが「ブラフが足りない」か、「ブラフが多いか」があります。

BTNのブラフが足りない場合

BTNはブラフが十分にできないとします。

その場合、BBはポットオッズに従ってコールしなくてよくなります。

ポットオッズに従っちゃだめ!

マージナルなブラフキャッチャーはフォールドします。

ミスを増加させる方法⇨タイトにコール

相手がブラフが少ないのに、ポットオッズに従ってコールすることはミスです。
(ブラフが少ない設定にしてソルバーで計算すると、あるハンドはコールがマイナスEVとなってでてくる。)

ここでアジャストしてオーバーフォールドした場合、BTNはバリューハンドにフォールドされてしまうことでバリューロスにつながります。

もちろん、BBも戦略を知られてカウンターエクスプロイトされればミス(-EVになる行動)につながります。

SBがBTNにオーバーフォールドを知られた場合、BTNはAヒットのハンドの大半をオールインしてくるからです。

BTNのブラフが多い場合

反対に、BTNのブラフが多いとしましょう。

その場合に、SBはトップペアやもしくはKハイまでポットオッズ的にコールします。

BTNのブラフの価値を減らすために、SBはコールすることによって彼らのミスを増やします。

ミスを増加させる方法⇨コールを増やす

ミスを増加させる方法って、各場面でのエクスプロイトの方法!
そっか、エクスプロイトを全体でとらえている人がいるから、各場面で違っているよってことを言いたいのか。
(ミスの定義は様々な解釈ができます。
ここでは、一つにGTO戦略通りにプレイしようとしていることが前提となり、そこから外れることをミスと解釈。もう一つにエクスプロイト戦略の最適解通りにプレイしようとしてそこから外れることもミスプレイと解釈しています。のちにミスについても再度とりあげます。)

エクスプロイト戦略をわけて考える

2つのメインになるエクスプロイト。

  • リアクティブ⇨対戦相手が逸脱した行動をしたでアジャストする
  • プロアクティブ⇨対戦相手が逸脱した行動をするにアジャストする(彼らのミスを先回りする)
さらっと触れているだけだけど、前と後で2つのアジャスト方法があるってことだけ覚えた!

さらにこの考え方をもとに、Nemesis(メネシス)戦略について考えていきます。

Nemesis(メネシス)戦略

メネシス戦略というのは「ゲーム理論」からの用語で本質的な意味はMESです。

  • MES =Maximally Exploitative strategy(最大限に搾取する戦略)
    MES⇨対戦相手のミスからバリューを最大限にとる戦略。
    対戦相手のミスに対してすべてのカウンターエクスプロイトを行う。
  • MinES =Minimally Exploitative Strategy(最小限に搾取する戦略)
    MinES⇨対戦相手がミスするであろうことを予測して、事前にエクスプロイトを立てておく戦略。
メネシスって検索するとギリシャ神話に登場する女神がでてきた!

「MinES」はアセベイドー(数学者でプロのプレイヤー)が出版した「In modern poker theory」(「現代ポーカー理論」2019年)に載っている概念です。

ある特定のミス(人の特性上おかしやすいミスなど)などを、事前にノードロック(戦略を固定させて解析)にかけてエクスプロイト戦略を練っておきます。

例えば、フロップでのCベットやリバーのチェックレイズでよくみるミスにアジャストさせる方法をソルバーで解析。

事前に相手のミスを予測してエクスプロイトを行います。

それらは事前に予習(プロアクティブ)ができるので、リスクが少ない方法です。

ただし、対戦相手ものちのストリートでそれらを分析して、このエクスプロイトに対して強固なエクスプロイトを出してくるかもしれません。

GTO戦略は人間の特徴を取り入れてるわけじゃないから、ある特定の場面で「人間ならばとか、この人ならこんなミスをする」というようなエクスプロイトポイントがある!

GTO戦略とエクスプロイト戦略にみられる共通した誤解

GTO戦略とエクスプロイト戦略にまつわる誤解を2つみていきます。

GTO戦略はローステークスにおいても利益的

「GTO戦略は他のGTOプレイヤーに対してだけ良い」というのは間違っています。

GTOは最もよい戦略であるのは間違いありません。

GTO戦略は競争相手のミスに対して、十分に罰する能力があります。

ある人はこう言うかもしれません。

「あなたはローステークスのゲームではGTOをプレイしてはいけない」と。

これは誤解です。

確かに、エクスプロイト戦略は弱いプレイヤーに対してGTO戦略より稼ぐことができるでしょう。

しかし、GTO戦略を理解することはあなたのエクスプロイト能力を強化します。

あなたのベースラインは?

弱いプレイヤーのバランスのとれてないことがわかっていなければ、どうやってエクスプロイトしたらいい?

GTO戦略はあなたが「エクスプロイトをミス」するのを防いでくれます。

自分のミスが少なくて、相手のミスが多ければ結果的に稼げる

GTO戦略はいつでも稼げるわけではない

「GTOは対戦相手の逸脱した行動からいつでも稼ぐことができる。」というのは間違っています。

消極的なエクスプロイトは対戦相手がピュアミステイク(EVがマイナスになる行動)をとったときにのみ稼ぐことができます。

「ピュアミステイク⇨決してプレイしてはいけないマイナスEVになるアクション」

頻度のミスからは得ることができません。

  • ピュアミステイク⇨GTO戦略で稼ぐことができる。
  • 頻度のミス⇨GTO戦略で稼ぐことができない。

実際にいくつかのスポットではレーキのコストを支払わされることもあります。

この誤解はもっともこの講義で伝えたいことです。

頻度のミスはGTO戦略で稼げないってどういうことだろう?
具体例とともに説明していきます。

GTO戦略は稼げるのか?

GTO戦略は稼げるのか?

この質問にたいして、ピュアミステイクからは稼げる、と回答します。

例えばこのようなシチュエーション。

問題です。
  • SB2bbオープン、BBコール。
  • フロップ「Q♠J♠5♥」
    SBは0.33xベット。
  • BB「9♠8♦」は何をしたらミスになりますか?
    (6maxにおけるGTOウィザードの練習モード)
コール、フォールド、レイズ、オールインのどれかを選んでみよう

答え

フォールドやオールインを選ぶと「ミス(ピュアミステイク)」になる。

厳密にはEVをロスします。

相手がピュアミステイクをした場合、SBはエクスプロイトをしていなくてもBBのミスにより利益を獲得します。

もしBBがここで低頻度でレイズをしたとします。

この行動はGTO戦略をとるSBに無関係で、EVロスになるわけではありません。

固定されたGTO戦略では、もしBBが98oでレイズを100%してきたとしても、BBのレイズサイズが適切な限りEVを失わないのです。

SBがエクスプロイトして戦略を変えてこない限り、これはEVロスにはなりません。

頻度のミスは固定された戦略では稼ぐことができない…
じゃあ、固定された戦略って何?
頻度のミスはGTO戦略では稼げない⇨GTO戦略は固定された戦略だから。
さらに説明していきます。

固定された戦略とは

固定された戦略は相手がどのようにプレイするかによって戦略を変えません

GTO戦略は固定された戦略。

同じスポットなら同じ方法で、そのレンジをいつもプレイします。

GTOウィザードはこのスポットならこの動きが正しいって答えをくれる!

固定された戦略に対して、動的な戦略はあなたの戦略をベースに合わせてきます。

多くの人は動的な戦略をとったり、固定された戦略と動的な戦略の間をとったり。

ポーカー上級者ならば、初めに固定戦略をとってからテーブルの層を見て、動的な戦略に切り替えたりします。

  • 固定された戦略⇨GTO戦略。相手がどのようにプレイしても自分のプレイをする。
  • 動的な戦略⇨相手の動きからプレイを変える。
固定された戦略ってそのまま戦略を変えないってことか

動的ということを具体例でみていきます。

動的な戦略とは

例えばこのシチュエーション。

(MTT 40bb)

  • BTNオープン、BBコール。
  • ボード「T♥5♦5♣」
    BTNベット。

解析結果ではフロップでBTNは60%の頻度でベット。

ただし、各ハンドに対しても何%ベットして、何%チェックするというようにほぼチェックとベットが混合されています。

ソルバーは正確にこの行動をするということを示しません。

そこには小さな偏差があります。

A♥8♥を見ると、少しの差でベットをするのが良いということがわかりますし、A♠8♠ではベットでもチェックでもEVが同じだと表示されています。

ここがナッシュ均衡の難しいところ。

イメージしてください。

BTNはチェックとベットが示されているけれど、ベットだけを選択して毎回ベットをします。

そして、BBはそれにアジャストできないとしましょう。
(例えば、「BTNはいつもベットするからゴミ手が含まれている可能性が高いので、コールを増やそう」というアジャストした動きができない。)

BBはそれにアジャストできなくてもGTO戦略に従っているかぎりEVロスをしません。

コールの方が良いように思えますが、フォールドをしてもEVが同じ。

つまり、BBはアジャストしなくてもミス(EVロス)にならないのです。

BTNがいつもベットをするという頻度のミスは、BBがGTO戦略に従う限り、EVロスがありません。

では、BBが動的な戦略(エクスプロイト戦略)をとって、ベットにたいしてチェックレイズやコールを増やしたとしましょう。

BTNはいつもベットする⇨BBはチェックレイズやコールを増やす。

このとき、BTNは戦略にアジャストされることによってEVをロスします。

BTNはBBのエクスプロイト戦略によって、このとき初めてEVロスになるのです。

  • 頻度のミス(いつもベット)はGTO戦略では稼げない
  • 頻度のミス(いつもベット)はエクスプロイト戦略で稼ぐことができる。

レンジベットやレンジチェックの頻度のミスをBBがエクスプロイトしてきた場合に、BTNは戦略を変えて適応させなければ負けてしまいます。

動的な戦略だけが「頻度のミス」から稼げるんだね!

固定された戦略と動的な戦略の比較

「頻度のミス」から稼ぐ能力が欠けているというのは固定された戦略の性質です。

すべての固定されている戦略は(アジャストしないということ)は相手のプレイに偏りがあっても、そこから稼ぐことができません。

これはGTO戦略の特徴というよりは、固定された戦略の弱点です。

「GTO戦略は稼げるのか?」という最初の質問に戻りましょう。

GTO戦略はピュアミステイクからは稼げるが、頻度のミスからは稼げない。
この2つのミスをまとめます。
  • 混合戦略のミス(頻度のミス)
    ・頻度が間違っている
    ・相手がアジャストしてくればエクスプロイトされる
    ・固定戦略によって罰されない。
  • ピュアミステイク(blunder、pure mistakes)
    ・相手の戦略に対して厳密にマイナスEVなアクションをとること
    ・対戦相手が戦略を変えなくても、EVをロスしていく。

2つのタイプのミスを知っておくことが重要です。

頻度のミスは対戦相手が戦略を変えた時にのみ罰されます。

例えば、あなたがブラフが少し多い状態でプレイしていたとしましょう。

コーリングステーション(なんでもコールする傾向で、もともとアンバランス)は自然にそれをエクスプロイトする戦略になっています。

コーリングステーションに勝てないなぁとなってきたら、ブラフ過多(バランスが偏っている)の可能性大!

この無差別(頻度のミスは無関係)という考え方を、さらに単純化したトイゲームから掴んでいきましょう。

GTOとエクスプロイトをトイゲーム「AKQゲーム」から把握する

「AKQ」を使ったトイゲームで具体例を見ていきましょう。

ポラライズ(Hero) vs ブラフキャッチャー(Villain)
(SPR=1)

  • Hero⇨ナッツ「AA」かブラフ「QQ」(100%勝つか、100%負ける)を持っている
    IP(インポジション)
  • Villain⇨「KK」マージナルハンドを持っている

リバーでのプレイで、ボード「33322」。

計算すると「ベットサイズ100%のとき、ポットオッズ33%、MDF50%、アルファ50%、バリューブラフ比2対1」がソルバーで示される正しい値です。
詳しくはこちら。
>>GTOからの基礎クイズ10

Heroはバリューブラフ比=2:1に従ってベット。
AAは100%ベット。(バリュー:2)
QQは50%ベット。(ブラフ:1)

KKはMDF(最小ディフェンス頻度)に従って50%でコール。

この値がGTO戦略の「バランスの良い頻度」です。(トイゲームなので、他の要素は排除。)

①両者がバランスの良いプレイをした場合

HeroもVillainもこの数値に従ってお互いがバランスの良いプレイをしたとします。

①HeroもVillainもバランスのとれたプレイ(両者がGTO戦略をとる)

  • Hero
    AAをいつもベットするとEVはポット分の$10と、Villainが50%でコールするのでスタックの半分$5。
    10+5=15
    QQは50%で勝って、50%で負けるのでEVは0。
    トータルEV=7.5
  • Villainは、ベットにあったときは0EV(AAとQQのそれぞれの場合を計算して合わせる)
    しかし、チェックバックするQQにはいつも勝利。
    10ドルのポットを4回に1回獲得(25%)できるので、EVは2.5。
    トータルEV=2.5

HeroのEVは7.5、VillainのEVは2.5という数値。

このEVは両者のプレイヤーが正しいバランスでプレイした結果です。

バランスの良いプレイは2人ともマイナスにならない!(ポットに10ドルがある状態)

では、一方が逸脱した行動をするとします。

Heroだけがバランスの良いプレイをした場合

問題です。

Hero(ポラライズ側)は完璧なバランスで2/3バリューベット、1/3をブラフします。

さきほどは50%の頻度でコールとフォールドをしていたVillain(ブラフキャッチャー側)が、常にフォールド常にコールをしたらどうなるでしょうか?

ここで2つの質問に答えてみてください。

Villainが常にフォールドするとしたら、誰が得をしますか?

  1. Hero
  2. Villain
  3. 誰も得をしない

Villainが常にコールをしたら、だれが得をしますか?

  1. Hero
  2. Villain
  3. 誰も得をしない
えっ、さすがに「頻度のミス」でもこのかたよりだと…
どちらの答えも③。
誰も得をしません。
「頻度のミス」はどれだけかたよっていても、ピュアミステイクじゃない!

Villainは「頻度のミス」をしています。

それに合わせて、「常にコールされるならばブラフをしない」、「常にフォールドされるならばブラフをする」のが利益的なのですが、Heroはその傾向にアジャストしていません。

その結果、Villainが常にフォールドしても常にコールしてもEVは同じです。

これは頻度のミスであり、純粋なミスではないのでHeroは稼げません。

実際に簡単な計算をしてみましょう。

Villainが常にフォールドした場合

(図は見えにくいですが、計算結果のEVは同じだと示されています。動画21分25秒)

Villainが常にフォールドした場合。

  • Hero
    AAをベットするとKKはフォールドするので+$10。
    QQはベットするとポット$10獲得し、半分はチェック(0)するのでEVは$5。
    (10+10+10+0)÷4=7.5
    トータルEV=7.5
  • Villain
    KKはいつもフォールドするけれど、4回に1回は$10を獲得(QQのチェックバック分)。
    トータルEV=2.5

EVは同じになります。

Villainが常にコールをした場合

Villainが常にコールした場合。

  • Hero
    AAはベットするといつも+$20。
    QQはベットすると-$10で、チェックすると0。
    (20+20-10+0)÷4=7.5
    トータルEV=7.5
  • Villain
    KKはベットを受けた場合にEVは0。(-10-10+20)
    KKは4回に1回はQQのチェックバックからポットが獲得できる。(ポット$10)
    (-10-10+20+10)÷4=2.5
    トータルEV=2.5
EVを計算してみても変わらないね!
さらに、Villainだけがバランスの良いプレイをした場合も見ていきましょう。

Villainだけがバランスの良いプレイをした場合

問題です。

Villainがいつもレンジの50%でディフェンスをして、Heroは常にブラフをする、常にブラフをしないという選択をしたら誰が得をするでしょうか?

AAのバリューベットは常にする、というのは前提!(ベットしないのはピュアミステイク)
誰も得をしません。

Heroが常にブラフをしたり、常にブラフをしない場合もEVは変わりません。

Heroが常にブラフをした場合

Heroが常にブラフをして、Villianがレンジの50%でディフェンスした場合を見てみます。

Heroが常にベットをした場合。

  • Hero
    AAの期待値はポット分の$10と、Villainが50%でコールするのでスタックの半分$5。
    10+5=15
    QQは50%で勝って50%で負けるのでEVは0。
    トータルEV=7.5
  • Villain
    AAからベットにあうと-10(コール)と0(フォールド)が半分ずつ。
    QQからベットにあうと+$20と0が半分ずつ。
    (-10+0+20+0)÷4=2.5
    トータルEV=2.5

Heroが常にブラフをしない場合。

Heroが常にブラフをしない場合

  • Hero
    AAは常にバリューベットをするので、EV=15というのは変わりません。
    QQは常にブラフをしないので、EV=0
    トータルEV=7.5
  • Villainは、AAからベットにあうと-10(コール)と0(フォールド)が半分ずつ。
    QQからチェックバックでいつも+10ドル。
    (-10+0+10+10)÷4=2.5
    トータルEV=2.5

あなたがもしこの結果に疑問を持つようならば、ソルバーで計算してみてください。

より理解が深まります。

無差別(indifferent、無関係)を理解すると、負けないためにもGTOを勉強しようってなるね!

では、GTO戦略とエクスプロイト戦略の関係をもっと複雑な具体例でみていきましょう。

GTO戦略とエクスプロイト戦略の具体例|リバーのバランス

「ミスを増加させる具体例」で取り上げた例題を再び取り上げます。

(スピン&GO 25-25-25)(3人で対決をするポーカー)

  • BTNオープン、BBコール。
  • フロップ「A♠9♥9♦」
    BTN0.22xベット、BBコール。
  • ターン「5♠」
    BTN1xベット(ポットベット)、BBコール。
  • リバー「2♣」
    BTNオールイン(0.79x)

このリバーのオールインを分析します。

BTNのポラライズレンジ(リバーオールイン)では、トリップスや「トップペア+グットキッカー」などをバリューでベットして、負けるだろう手をブラフにまわします。

この構成はトイゲーム(AKQゲーム)と似ています。

Aがバリューで、Qがブラフ。

トイゲームではお互いが戦略を変えることがなかったので、結果のEVは同じでした。

なので、ここではピオソルバーを使って、戦略を変えたらどのような動きになるのかを見てみます。

戦略を変えた後の最適解って気になる…この動きを調べるのはプロアクティブだね!

リバーでまずはBBチェック。

それに対するBTN側レンジを見てみると、多くがトップペア、少しのトリップス、少しのKハイが残っています。

1つだけを変えてみましょう。

QJoをいつもベットするように設定してみます。

ブラフを多くするとどうなるのか

(動画25分35秒の画像。本来の動き。BTNはリバーで赤い部分をベット)

QJoは本当なら半分以下のベット頻度ですが、100%ベットするとします。

他はすべてそのまま

ブラフだけを増やすよ

元のシナリオではトリップスはコールして、Aハイもいくつかはフォールドとコールを混ぜています。

(QJo⇨元のまま。BBがベットを受けた画像。「コール55%、フォールド45%」)

次に、QJoをすべてベットする設定にした画像はこちら。

(QJo⇨すべてベット。BBがベットを受けた画像。「コール98%、フォールド2%」)

!!??本当に!?

BBはすべてのAヒット、すべてのKハイもコールです。

BTNのベット頻度は「55%⇨58%」(QJoのみベットを増やした)と、あまり変えていないにもかかわらずBBは「コール98%」という結果がでてきました。

均衡は壊れやすいのです。

ポラライズされたこのようなリバーのスポットでは特に。

変わりすぎ…
元(QJoを変えていない)のエクイティ分布図をみてみましょう。
(動画27分35秒の個所)

青い線がBBのレンジ。
緑のラインがBTNのレンジ。

BTNのブラフが増えるとBBはただしいポッドオッズに従うことができなくなります。

ポラライズされているシーンでは特にその傾向があります。

青と緑の線が縦に交わってる個所が変わっちゃうから、ポラライズなレンジは特に壊れやすい
均衡が崩れた結果、「レンジコール」か「レンジフォールド」になり、QJoを100%ベットするとほぼ「レンジコール」になります。

設定を変えてみましょう。

ブラフを少なくするとどうなるのか

QJoをすべてチェックにする設定にします。

ブラフが足りない状況です。

(QJo⇨チェック。「コールが24%、フォールド76%」)
トリップスのみコールします。

「相手のバリューに勝ってるかも」ってハンドでだけコール!

すべてのAハイはフォールド。

2%ブラフが足りないだけでこのようなことが起こります。

ソルバーは複雑な計算からEVを計算しています。

ここでコールするとEVを失う、と。

ブラフ過多、ブラフ不足に対応するには

エクスプロイトをEVで考えてみましょう。

このスポットで対戦相手はバリューヘビー(ブラフ不足)だ、と。

そのとき、トリップスはコールするけれど、それ以外のAハイはフォールドします。

それらのエクスプロイト戦略をとったときにEVはどう変わるのでしょうか。

(EV表に関して数値を省略して載せていきます。細かいデータ結果は動画30分の個所)

OOPがエクスプロイト戦略をとった場合

IPがオーバーブラフをして、OOPがほぼコールをした場合。
「IP⇨-4.9EV、OOP⇨+4.9EV」

IPがブラフが少なくて、OOPがオーバーフォールドをした場合。
「IP⇨-2.6EV、OOP⇨+2.6EV」

実際のプレイは「ほぼコール、バリューだけコール」と変わっていたけれど、EVの数値で見ると変化が少ないような気がします。

ところが、ここでさらにそのエクスプロイトをカウンターエクスプロイトした数値を見てみましょう。

IPがカウンターエクスプロイトをとった場合

OOPのほぼコールに対して、IPはバリューのみをベットした場合。
「IP⇨+34EV、OOP⇨-34EV」

OOPのバリューのみコールに対して、IPはブラフをほぼベットした場合。
「IP⇨+39EV、OOP⇨-39EV」

OOPはIPに対してエクスプロイトをすると、小さなEVをたくさん獲得できます。
(たくさんというのは、このようなシチュエーションがよくあるから)

しかし、このエクスプロイトに相手がアジャストしてカウンターエクスプロイトをしてきた場合、かなりのEVをとられてしまいます。

初めにアジャストしたよりも大きいEVロスです。

この段落をまとめます。

  • ポラライズされたレンジは、数%の誤差で各ハンドの対応がガラッと変わる。
  • ブラフ過多、ブラフヘビーをエクスプロイトする場合、単純なオッズ計算に従わない。
  • エクスプロイトすることでの+EVはわずかでも、カウンターエクスプロイトのEVは大きい。
エクスプロイトのエクスプロイトのエクスプロイト…とやってるのがテレビとかでみる面白いプレーになってるのかも!

GTOとエクスプロイトの具体例|ドンクベット

問題です。

(6MAX、50nl、100bb)

  • BTNオープン、BBコール。
  • フロップ「7♥6♦4♣」
    このボードではBBがよくドンクベットをします。
    ベット65%、チェック35%」
  • なぜBBはこのボードでドンクベットをするのですか?
    ①ナッツアドバンテージがあるから
    ②レンジアドバンテージがあるから
    ③BTNにチェックバックされるのを防ぐため
    ④BTNに警戒心をもたせるため
あれ?よくナッツやレンジアドバンテージで説明されるけど…

答え

正解は③

BTNは多くの場合、チェックバックを返します。

もちろん、BTNのチェックバックの理由にはBBにナッツアドバンテージがある、という理由もあります。

BTNは警戒しているからこそ、チェックを選択。

しかし、それよりも強い理由は③の「BTNにチェックバックされるのを防ぐため」。

その理由をさぐるために解析をしていきます。

BBが決してドンクをしない」と何がおこるのでしょうか?

もっと論理的な正解を導き出していくんだね!

ドンクベットをしないと何がおこるのか

設定でBBがドンクをしないようにしてみます。

BBは100%チェック。

すると、BTNは「ベット9%、チェック91%」というほぼチェックバックするエクスプロイトを仕掛けてきます

エクスプロイト
BBがドンクしない⇨BTNはチェックバックする

BTNがほぼチェックバックするというのが、BTNの最適なエクスプロイトです。

レンジアドバンテージを比較してみましょう。

レンジ図からはBBがよりナッツハンドをもっていることがわかります。

セットやストレートや2ペア、ドローなどもBTNと比較するとBBはより持っています。

通常、レンジ図のブルーのライン(コーラー側)は下になる傾向があるのですが、このようなフロップではレンジアドバンテージは中立的。

さらに、ナッツアドバンテージはBBにあるので、アグレッシブになるのが許されます。

普段ドンクベットしない理由の一つはアドバンテージがアグレッサー側にあるから!

もしBBがドンクレンジを持っていなくてレンジチェックをするようなら、ボタンはただ単に大量のチェックバックをするだけでエクスプロイトになるのです。

このBTNの戦略はBBのナッツアドバンテージを鈍化させます。

チェックすることで、BBはバリューも少なくなるからです。

BBがドンクしないことに対するエクスプロイトはチェックバック。
チェックは簡単にエクスプロイトされる!
その行動をしないことによるエクスプロイトを見ることで、実際にEVロスにつながることがデータから明確になります。
相手の行動を見ることで、自分がどう動けばいいかわかる!
この考え方はプリフロップの基礎でも取り扱ったよ
>>プリフロップの基礎

ドンクベットをすると何がおこるのか

65%ドンクが許された状態だとしましょう。

この状態でBBがフロップでチェックするとしても、BTNはチェックバック戦略をとりません

BBがドンクをするという前提にあると、BTNは「ベット45%、チェック55%」という比率になるからです。

  • BBがドンクしない設定⇨BTN「ベット9%、チェック91%」
  • BBがドンクをする設定⇨BTN「ベット45%、チェック55%」
BBがチェックで同じ行動をするとしても、前提が違うとBTNの動きも違うんだね!

他にも、このようなBBにとって良いフロップは相手に間違いをおこさせるエクスプロイト戦略があります。

フロップが有利な場合のエクスプロイト

例えば、BTNがすべてベットするような戦略をとっていたら?

「764」というBBに有利なボードでもいつもベットをしていたら?

サイズをより大きめにしてベットしていたら?

BBのベストな動きはドンクベットではなくレンジチェックをして、BTNに間違いを起こさせることです。

その場合にBBはドンクしません。

BTNのベットにBBはチェックレイズをして広くコールしてもらいます。

エクスプロイト
BTNがいつもベット⇨BBはチェックしてからレイズ(チェックレイズ)をする

ソルバーの行動からエクスプロイトを考える

なぜソルバーはドンクを選択しているのか?

多くの人はこう答えます。

「ナッツハンドで稼がなきゃ!」と。

BBにナッツアドバンテージがあるという事実もあります。

しかし、あなたはこのスポットで「なぜここでソルバーはドンクを選択しているのか?」、「ドンクをしなければどうなるのか?」という分析をすることが大切です。

分析をすることで、エクスプロイト戦略が見えてくるからです。

このボードでBBがドンクしなければ、BTNはチェックを増やすというエクスプロイトができます。

もしBTNがBBに有利なレンジでもいつもベットをしていた場合、BBはBTNのミスに対してチェックレイズができます。

  • 相手のミスをソルバーから発見する
  • 相手のミスをつくエクスプロイトをソルバーから発見する
  • 自分のミスがどうエクスプロイトされてしまうのかをソルバーから発見する

そのような動的な戦略(エクスプロイト戦略)をGTO戦略は作り出します。

有利だからドンクじゃなくて、エクスプロイトされないためにドンク!

この章の要点

  • BBはドンクしないと、BTNにチェックバックというエクスプロイトを受ける。
    「頻度のミス」はどのようにエクスプロイトされてしまうのかをソルバーから知る
  • BTNがいつもベットをするならば、有利なボードではチェックレイズを増やす。
    「頻度のミス」をどのようにエクスプロイトできるのかソルバーから知る

ドンクをしないという「頻度のミス」、いつもベットをするという「頻度のミス」はどのようなエクスプロイトにつながるのか。

それを考えると適切な行動がとりやすくなります。

GTOとエクスプロイトの具体例|プリフロップ

HJのプリフロップ戦略からエクスプロイトを考えていきます。

GTOには選べるソリューションがあります。

ここでは2つを比べてみましょう。(50nl cash 100bb deep)

  • 「General solution」⇨あなたのオープンにみんながコールできる
  • 「Simple solution」⇨BBだけがコールできるが、他の人は3betかフォールドしかできない。

2つのソリューションのオープン比率を比べてみます。

「General solution」の場合「レイズ21.6%、フォールド78.4%」、よりタイト

「Simple solution」の場合「レイズ24.4%、フォールド75.4%」、よりワイド

オープン頻度が約3%ほど違っています。

では、問題です。

なぜ「Simple soution」の方がレイズ率が上がるのでしょうか?

Simpleの方が「頻度のミス」が少なそう…
答え
HJはコールに対してそこまで稼ぐことができないから。
(They can’t be punished with calls as much⇨直訳「彼らはコールで罰することはできません」)

Simpleの戦略では、コールのかわりにレイズかフォールドしかできません(BB以外)。

しかし、ここにコール戦略を付け加えることで、よりよいディフェンスができるようになります。

コールがあることによって、HJはよりタイトなオープンをするようになっているのです。

コールが多い環境下ではよりタイトにする!

2つのアクションがとれることによって、HJの行動を狭めています。

つまり、HJへのエクスプロイト方法は1つのアクション(レイズ)よりも2つのアクション(レイズとコール)をとること。

逆にHJからすれば、相手の行動によってエクスプロイトされないためにオープンレンジをワイドにしたりタイトにしたりします。

エクスプロイトまとめ

  • 対戦相手がコールしない(レイズのみ)⇨オープンレンジをワイドにする
  • 対戦相手がコールとレイズを混ぜる⇨オープンレンジをタイトにする

「もしその行動をしなければ、対戦相手はどういう行動をとってエクスプロイトしてくるのか」を考えて適切な行動に移します。

なんでマイクロステークス(3bet少ない)でタイトにオープンして稼ぐ人がいるのかなって思ってたけど、それがエクスプロイトになってたんだね

GTOとエクスプロイト|ターンコールの具体例

例題から問題をだします。

(この章の正しい%や詳細が知りたい人は、動画38分の個所から見ることをおすすめします)

(6max general 100bb nl500)

  • BTNオープン、BBコール。
  • フロップ「A♠K♠3♥」
    BTN1.25xベット、BBコール。
  • ターン「3♦」「A♠K♠3♥3♦」(19.3bb)
    BTN1.25xベット、BBコール。

ターン 125% でオーバーベットした後、BTN がリバーでギブアップする頻度はどれくらいですか?

この質問の答えは複雑なので、それを解説とともに追っていきます。

このラインはとても面白いスポットで、レンジベットではBTNが大きく打つように示されています。

フロップ

フロップBTN「1.25×32%、チェック65%」

BTNの方に多くあるナッツハンドで大きく稼ぐことができます。
強いトップペア「AQ、AJ、AT」など。

BTNが大きなベットをする理由としてBBは十分なナッツハンドをもっていません。

ナッツハンド%「BTN>BB」

なので、BTNは大きなサイズのベット(32%)か、チェック(65%)をするスポットです。

フロップ「A♠K♠3♥」
BTN1.25xベット、BBコール。

実際に大きくベットしたところ、BBはコールしてきました。

ターン

フロップで125%ベットをしたことにより、両者のレンジバランスはとても壊れやすいものになっています。

あっ、さっきの例題で「QJo」をブラフするかチェックするかに変えた状況と一緒だ!

このスポットでBBは「ベット13%、チェック87%」とドンクするレンジがあります。

多くはフラッシュドロー完成の♠が落ちた場合。
例えば9♠だと、60%ドンクしています。

セカンドヒットのKが落ちた場合も、スートによってドンク(K♦、K♣で22%)が発生。

なぜこんなにもドンクがあるかというと、オーバーベットをコールしたBBのレンジは「コンデンスドレンジ(中間の強さ)」で、ドローをたくさん含み、ターンのカードによって強さが変わりやすいからです。

特にセカンドペアが落ちれば、それがそろっている可能性が高いと思われます。

ただし、「3♦」はブリック(多くの場合状況を変えない)です。

ターンでブリックが落ちた場合に、BTNは強いベットを継続します。

BTN「ベット1.25×43%、チェック54%」

BTNは続けてバリューの場合はトップペア+以上の手でベットします。
トリップス、セットなども1.25xベットを継続。

ブラフするハンドは様々。
多くは♠を一枚もっているハンドです。

さて、ここでもう一度問題を考えてみます。

ポットオッズを使った回答

ターン 125% でオーバーベットした後、BTN がリバーでギブアップする頻度はどれくらいですか?
(How often should BTN give up on the river after overbetting turn 125%?)

ここは意見が分断されると予想されます。

絶対あきらめないという人もいれば、よりフォールドしようと言う人もいます。

一般的な回答としてBBのポットオッズを計算してみましょう。

125(call)/125(bet)+125(call)+100(pot)=0.3571…
【ポットオッズの簡略化計算式 pot odds =call /(bet + pot + call)】

BBはコールするのにレンジの35%のエクイティでこちらに無差別(無関係)でコールしてきます。

では、このBBの動きに対してBTNはどのくらいギブアップすべきなのでしょうか?

ここでの問題は4択になっています。

①0%、②25%、③35%、④55%

答えは③の35%。

BTNが125%ベットを打って、それにBBがコール。
リバーで何がが落ちてBBがチェックしたとした場合に、BTNはレンジの35%でチェックバックします。

ただ、これはBBのポットオッズと比較する以上に他の計算も含んでいます

つまり、ここで伝えたいのはポラライズされているシーンでは正しいGTOソリューション通りのプレイをするのは難しいということ。

動画ではGTOウィザード分析からピオソルバー分析に切り替えています。

リバーはリバーで落ちたカードや相手の動きによって再考するよ!
とりあえずの回答は35%だけど、これはほんの少しのことで切り替わる…

ターンのベットがブラフ不足な場合

QJoの例題で話した通りに、ポラライズされたレンジは数%の違いで対応が変わってきます。

「正しい計算」に従って、「ここではベット、ベット、ベットだ!!」という人もいるでしょうが、それは昔のポーカーです。

トイゲームで単純な計算をした場合に、ターンでBTNがブラフ不足だったとします。

こういうポラライズしたベットってその人の特徴が現れちゃうよね!
大半はバリューヘビーかな

ターンの125%ベットの内訳が少しタイトな場合。

計算上はブラフを約60%含まなければいけないのですが、そこまでブラフを含むことができなかったとします。

「BTNのターンの125%ベット」がブラフ不足な場合(バリューによっている)、BBはコールはせずに約10%でレイズか、90%でフォールドです。

「A♠K♠3♥3♦」に対して、BBはほぼ「3」をもっている場合だけレイズで他はフォールド。

問題ではリバーでどう選択するかと述べましたが、この場合にはBTNがリバーを考える前に勝負が終わっています。

ターンのベットがアンバランスな場合まとめ

人によってはターンのポラライズベットをブラフを多めに打ってきます。

その場合にはBBのブラフキャッチャーがほぼコールに傾きます。

まとめ

  • ポラライズなレンジではバランスが少しのことで崩れやすい
  • ポットオッズ計算に従わない方が利益的なスポットが、均衡が崩れやすいレンジには特にある
  • ブラフ過多な場合とブラフ不足な場合のエクスプロイトを知っておく
フォールドエクイティを扱ったときにもレイズorフォールド戦略ってあった!
>>フォールドエクイティとは

対戦相手のブラフとバリュー比率がアンバランスな場合には、それに合わせたエクスプロイト戦略を知っておくと利益的です。

GTO戦略とエクスプロイト戦略のまとめ

この質問に答えられれば、この動画の結論を理解していることになります。

なぜソルバーはXという行動をとるの?

答え

もしXを行わなかったら、対戦相手はYという行動をしてそれをエクスプロイトできるから。
この質問と答えはGTO戦略とエクスプロイト戦略の両方から成立しています。
2つの戦略を理解することで答えることができます。
ここから言えることは、すべての頻度をメモしたり、全体を見ずに一つのハンドの正解を見たりといった勉強方法は時間を無駄にしてしまいます。
いくつかのゾーンを覚えるよりも、戦略を見つけ出すことです。
もしあなたがエクスプロイトよりのスタイルをとっていた場合、どのようなカウンターエクスプロイトができるのか、ということも調べましょう。
エクスプロイトスポット(プロアクティブ)を学ぶことが、自動操縦的なエクスプロイト方法を学ぶよりも必要です。

そして、GTO戦略を学ぶことでバランスの良いプレイを身につけてエクスプロイトされないようにしましょう。

GTOに従うことはエクスプロイトされない方法だし、エクスプロイトする方法はGTOが教えてくれる。

用語まとめ

  • GTO戦略
    ・弱点を最小限にしたバランスの取れたスタイル
    ・ナッシュ均衡の原理に従っている
    ・最大化された固定戦略
  • エクスプロイト戦略
    ・対戦相手のバランスの取れていない部分をついたスタイル
    ・動的な戦略であり、対戦相手にごとに適応する
    ・カウンターエクスプロイトにあう危険性がある
  • リアクティブ⇨対戦相手が逸脱した行動をしたでアジャストする
  • プロアクティブ⇨対戦相手が逸脱した行動をするにアジャストする(彼らのミスを先回りする)
  • MES =Maximally Exploitative strategy(最大限に搾取する戦略)
    MES⇨対戦相手のミスからバリューを最大限にとる戦略。
    対戦相手のミスに対してすべてのカウンターエクスプロイトを行う。
  • MinES =Minimally Exploitative Strategy(最小限に搾取する戦略)
    MinES⇨対戦相手がミスするであろうことを予測して、事前にエクスプロイトを立てておく戦略。
  • ピュアミステイク⇨GTO戦略で稼ぐことができる。GTOがとらない-EVになるアクション。
  • 頻度のミス⇨GTO戦略で稼ぐことができないが、エクスプロイト戦略で稼ぐことができる。
  • 無差別⇨無関係

 

(ここからGTOを登録すると10%割引になります)

前回紹介したGTOウィザード動画はこちら。
Fundamental preflop theory
>>プリフロップの基礎
海外戦略
KKpokerの登録方法
詳細はこちら
KKpokerの登録方法
詳細はこちら