ゲーム理論とは? 囚人のジレンマからナッシュ均衡まで具体例で解説

Marketing

はじめに

日常生活やビジネスの場面で「相手がどう出るか分からないと、自分の最適行動が見えない」──そんなジレンマに陥った経験はありませんか?

ゲーム理論は、まさに「複数の意思決定者(プレイヤー)が、お互いの行動を予想しながら戦略を選ぶときに、どのような結果が生じるか」を研究する理論体系です。本記事では、ゲーム理論を学ぶ上で知っておきたい以下の5つの用語を分かりやすく解説します。

  • 囚人のジレンマ
  • ナッシュ均衡
  • パレート最適
  • フォーク定理
  • トリガー戦略

囚人のジレンマ

1.問題設定

ある犯罪の共犯者である2人の囚人(AとB)が、別々の部屋で取調べを受けています。検察はどちらか一方だけ有罪を認めれば重い刑(10年)を科せますが、両方とも黙秘すれば軽い証拠不十分の刑(1年)で済ませる、という条件を提示します。

B:協力(黙秘)B:裏切り(自白)
A:協力A:1年, B:1年A:10年, B:0年
A:裏切りA:0年, B:10年A:5年, B:5年
  • 協力黙秘
  • 裏切り自白

2.ポイント

  • 両者が協力すれば(黙秘し合えば)お互い1年ですむが、
  • 互いに「相手が黙秘するなら自白して無罪を狙おう」と考え、結果的に両者が自白するとお互い5年の重刑になってしまう。

このように、個々が合理的に行動しても、全体としては最適解を逃してしまう典型例が「囚人のジレンマ」です。


ナッシュ均衡

1.定義

ジョン・ナッシュが提唱した概念で、全てのプレイヤーが「自分だけ戦略を変えても得をしない」戦略の組み合わせを指します。囚人のジレンマで言えば、両者が自白する(裏切る)──ここでは「自白、自白」がナッシュ均衡にあたります。

2.ポイント

  • 各人が自分の戦略を一人称的に最適化した結果、
  • 誰も戦略を変えようとしない(=変えても自分の利得が下がるか同じ)状態。

ナッシュ均衡は「社会全体で最適」とは限らず、むしろ「個々の合理性が衝突したときに生まれる平衡点」と捉えられます。


パレート最適

1.定義

イタリアの経済学者ヴィルフレド・パレートにちなむ概念で、
「誰か一人の状況を改善するには、必ず誰かの状況を悪化させなければならない」資源配分状態を指します。

2.囚人のジレンマとの対比

  • 両者が自白して5年ずつ受ける状態は、
    → 片方だけ協力に変えても、必ず裏切った側の負担が増えるため、パレート最適ではない。
  • 両者が協力して1年ずつ受ける状態は、
    → どちらかの刑を減らすには必ずもう一方の刑を増やさねばならず、これがパレート最適

フォーク定理

1.背景

フォーク定理(Folk Theorem)は、繰り返しゲームにおける業績です。一度きりのゲームと違い、同じプレイヤー同士で何度も対峙する場合、協力的な均衡が生まれ得ることを示します。

2.ポイント

  • 限りなく多く(あるいは無期限)に繰り返されるゲームでは、
  • 「相手を裏切ると以降ずっと罰(裏切りへの報復)が返ってくる」と見なせるため、
  • 長期的に見れば協力行動(パレート最適状態)を維持する動機が生まれる。

フォーク定理は、「繰り返し」「将来への影響(割引率)」が鍵となり、十分な将来価値がある限り、協力的なナッシュ均衡も可能になると教えてくれます。


トリガー戦略

1.定義

フォーク定理を具体化する一例。
「相手が協力している限りこちらも協力を続けるが、一度でも裏切られたら以後ずっと裏切り続ける」というシンプルな戦略です。

2.特徴

  • 協力フェーズ:相手が協力している限り、協力→お互い利益の高い状態を継続。
  • ペナルティフェーズ:相手が一度でも裏切ったら、永続的に裏切り返すことで、裏切りへの抑止力を生む。

このように一度の裏切りで永久に罰を与える仕組みが、繰り返しゲームにおける協力関係を支える強力なメカニズムとなります。


おわりに

ゲーム理論の基本用語を理解すると、「人と人の相互作用は数学的にも整理できる」という新たな視点が得られます。

日常のビジネス交渉や組織運営、さらには国際関係においても応用可能な奥深い理論です。まずは今回の5つのキーワードを押さえ、次はより実践的なモデルや応用事例にチャレンジしてみましょう!


参考文献・リンク

  • J.ナッシュ『非協力ゲームの均衡点』
  • R.セイロ『ゲーム理論入門』
  • Wikipedia(囚人のジレンマ/ナッシュ均衡/パレート最適/フォーク定理)

コメント

タイトルとURLをコピーしました