ポーカー(テキサスホールデム)とゲーム理論|均衡戦略って何?

テキサスホールデムの勉強をするために「ポーカーとゲーム理論」を読みました。

keu
ポーカーにはゲーム理論が必要といわれているから勉強!
まずはなぜゲーム理論が必要と言われているのか。
本を参照にみていきます。

テキサスホールデムにゲーム理論は必要?

本でゲーム理論を説明している個所を抜粋。

ゲーム理論は不確実性の状況下における意思決定についての理論だ。
相手がどんな手を持っているのか我々には分からないが、持っている可能性のある手ならわかる。
相手が何をしてくるかは分からないが、相手が何をしてくる可能性があるかなら分かる

ポーカーは不確実性の状況下にあるゲームです。

私たちの直感や、経験だけでは捉えきれない状況下にあふれています。

なので、ポーカーにはゲーム理論が必須!

keu
ゲーム理論はそれなりによい結果をもたらすような戦略をつくる手助けをしてくれるんだね!

テキサスホールデムで均衡について考える

ゲーム理論を理解するには均衡から理解します。

均衡とは

テキサスホールデムにおいて均衡と戦略という言葉を使い分けられるようにしましょう。

戦略とは
「発生し得るあらゆる状況で、その時持っているかもしれないあらゆるハンドの場合について、何をすべきかを厳密に言い表したもの

均衡とは
「あるゲームに参加している全プレイヤーが用いる戦略の集合で、この時どのプレイヤーにも自分の戦略から一方的に離れたくなるような要因が存在していない状態をいう」

ポーカーで戦略を考えるならば、リンプインは何%しないほうがよいとか、ドンクベットはこの場面ではしないほうがよいだとか、ある一定の期待値から定まっている、ある程度の方向性をもった考え方です。
そして均衡は、あるきまった戦略をみんながとり、他の戦略をとろうとは思わない状況です。
例えば、あなたは道路の左側を車で走ります。
なぜですか?
keu
えっ、反対を走ると他の車とぶつかっちゃう!
そのリスクを回避するためにも、私たちは左側通行を守り、あえて右側通行にするというリスクをおかしません。
私たちはずっとこのルールを守ることである一定の利益を得ると言う均衡を保っているのです。
この自然に出来ているルールがベスト!
全員が同じルールに従います。
ここではみんなが左側通行をするというのが均衡であり、みんなのベスト解ということです。

テキサスホールデムにおける均衡とは

この均衡をテキサスホールデムに適応しています。

すると、ある一定のルールやこうすると良い、という均衡を身につけていったとします。

車で例えるとみんなが左側通行をする。

これが均衡を保っている状況。

リンプインをある程度しないだとか、レイズの掛け率だとか、参加レンジ率だとか、そのような最適解を身につけたとします。

みんなが最適解を選ぶことでプラスマイナスゼロの状況を作り上げます。

そのときに、例えば車だとして右側を走る車がでてきたらどうでしょうか?

あ、危ない!!
均衡を学んだ人からすれば、危険なプレイだったり、変なプレイのように感じられてしまうという事。
例えて言うなら、車を走らせるルールを覚えていない人のように感じられてしまいます。
ポーカーを学べば学ぶほど、均衡のようにその戦略から離れていかなくなるのです。
keu
外国に行かない限りや法律が変わらない限り、私は左側通行を守るかな
では、この均衡という考え方から、ポーカーで利益を得るにはどうしたらいいのでしょうか?

テキサスホールデムにおける均衡戦略

望ましい均衡をずっととる。

では、果たししてこの状況は戦略になりうるのでしょうか?

みんながみんな最適解をしていたとしたら、勝負になりません。

なぜなら、車が左側を走ることが当たり前になり、その他の選択は頭に浮かばなくなるからです。

そこを考えるのが均衡戦略!

あるプレイヤーが2つ以上の戦略的選択肢の間でより好ましいものが無い場合、彼はそれらの選択肢に対して無差別であるという

例えば、私はさきほど外国にでも行かない限り、もしくは、法律が変わらない限り左側道路を走ると述べました。

なので、そんな法律の無い国にあなたを連れ去ってしまいます!

目を開けた時、あなたは車に乗っていましたが、他の車は右側通行をしていました。

keu
ここのルールは右側通行なんだ!
そう思ったあなたは右側通行をしばらくしていました。
が、突然と左側通行をする車も現れだしました。
keu
時間によって、左右が逆転するのかもしれない
均衡戦略の中には無差別が数多く含まれています
「これで合っているかな?」
と思いきや、違っていた、ということがあるのです。
ただし、そこに一定の最適解があるということではなく、50%の選択をしたことが正しい事というような状況。
よく、「ポーカーは進化している」とか、「それは昔の考え方」と述べますが、戦略は進化するということです。

無差別にするとは相手から「より好ましい選択肢」をなくすことである

本ではこのように述べられていました。

均衡戦略の無差別を生み出すためにはどうしたらいいのか

均衡戦略ではそれがあたり前に正しい事として認識されています。

均衡では相手が正しいプレイをしていると想定します。
それならば、正しいプレイを存在させなくてしてまおう!
ポーカーにとって重要なのは不確実性の元で優れた判断を下せるように学習することだ、と本で述べられています。
不確実性を強調する状況を作り出す手助けをするのがゲーム理論。
君のゴールとなるのが、相手にとって正しいプレイが存在しない状況を作り出すこと
あなたが車を右で走らせたり、左で走らせたりすれば、相手は今までの戦略をとれなくなるのです。
この右で走らせたり、左で走らせたりと状況が変わることを混合戦略と言います。
混合戦略とは参加者が行動を確率的に選ぶような戦略をとることで均衡になるゲーム
今までは左側を走れば正解だったのですが、状況が変わるとここでの最適解が変化!
最適解が確率になり、これが無差別になります。

ゲーム理論は、相手がどんなアクションを取るかに関わらずそれなりに良い結果をもたらしてくれる戦略を作る手助けです。

keu
ゲーム理論では相手の癖とは別に確率を考えていくんだね!
相手が正しい判断をする可能性を下げていきます。
ちなみに、相手の戦略がわかったとしてその戦略をついていくことをエクスプロイト戦略といいます。

エクスプロイト戦略とは

相手の戦略がわかるようならばそれはエクスプロイト戦略をとればいいのかもしれません。
エクスプロイト戦略とは、相手のプレイを読んで、その弱点をついていくもの。
いわゆる搾取という意味です。
ちなみに、ゲーム理論ではいっさい搾取は行われません。
ここで気をつけなければいけないのは、ゲーム理論もエクスプロイト戦略もそれは相手を考えるための一つのツールでしかないということ。
絶対にこれに従うというわけではなく、時と場合で道具を使い分けていくことが必要だと本で書かれています。
keu
旅人の上着を脱がすのに、太陽の熱の方が役にたったり、風の力の方が役に立ったり、使い分けだね!

テキサスホールデムで戦略を増やしていこう!

均衡戦略とは、お互いがもっともよい戦略をとれていること。

正しいプレイをしていれば期待値がマイナスにならない、つまりお互いプラスにもマイナスにもならないというのがゲーム理論。

この戦略に従っているとお互いに最適解になるので、これをとらせないようにすることが無差別化することです。

車が左右に走る状況をあなたが見たとするならば、車を走らせる道路における均衡戦略は崩れていきます。

それでも、あなたも私も正しい最適解を知っているからこそ、できる戦略になってきます。

keu
車に慣れてないと、どちらの道路が正しいのかってこともわからないよね

エクスプロイト戦略とは、相手の弱点をつくこと

あなたが最適解をわかっているからこそ、相手が変だなとか、妙だな、といったプレイがわかってきます。

そうでなくても、「この人はこんな癖がある」

と弱点が見抜かれた場合に利益がでるのがこの戦略。

本ではこのふたつの戦略を駆使して、テキサスホールデムポーカー上達への道が示されていました。

keu
不確実性の中での優れた判断をする!かっこいいな!
ポーカー初心者に役立つ情報はこちら。
テキサスホールデムポーカー初心者ブログ
>KKポーカーとは?

KKポーカーとは?

初心者はエムホールデムからスタート! ポーカーが上達した方に「KKポーカー」を紹介します。

「KKポーカー」とは?登録方法や注意点を紹介
詳細はこちら
「KKポーカー」とは?登録方法や注意点を紹介
詳細はこちら