グリコのゲームの最適戦略

  2人のプレイヤーが次のルールによりゲームを行う。まず、スタート地点にいる2人がじゃんけんをして勝った方が前へ進む。グーで勝ったなら3m、
 チョキまたはパーで勝ったなら6m前へ進むことにする。これを繰り返し行う。この時、グー、チョキ、パーをどの比率で出すべきか?

 高さ1の正三角形の中の任意の場所に点Pを打つ、点Pから三辺(AB.BC.AC)に垂直になるような線を引く。この3本の垂線の長さを合計すると1となる。
  (図1)

  AD=1   PE+PF+PG=1
  
  したがって、PEの長さをグーを出す確率、PFの長さをチョキを出す確率、PGをパーを出す確率とすれば、点Pを打つ場所がある1つの戦略と対応している
 事が分かります。
  ここで2人のプレイヤーをプレイヤーA、プレイヤーBとして、プレイヤーBがグーしか出さない時のプレイヤーAの利得を考えます。
 ここでいう利得とは、(プレイヤーAの進む距離)-(プレイヤーBの進む距離)とします。するとプレイヤーAがグーを出した時は0チョキなら-3パーなら6とな
 ります。プレイヤーBがグーを確率1で出した時のプレイヤーAの各戦略に対する利得の期待値を図で示すと下図(図2)のような立体図形になります。
  (図2)
  ※この図は、利得がマイナスの値をとらぬように全ての場合に6をプラスしたものです。
 SB=12 TC=6 UA=3
 点Pから三角形STUへ垂直に伸ばした直線上にある三角形STU上の点をQとします。線分PQの長さは、プレイヤーAがPに対応する戦略をとった時の利得
 の期待値に6を加えたものです。
  プレイヤーBがチョキのみ出した場合は次のようになります。
   (図3)
  T1C=9  U1A=6
  プレイヤーBがパーのみ出した時は次のようになります。
  (図4)
 S2B=6 U2A=12
 図2と図3の立体図形は底面に同じ正三角形ABCを持ちますが、この底面にある図2と図3の正三角形ABCをXY平面上で重ねます。すると下図(図5)の様に
 なります。
 
  (図5)
  線分USと線分U1S1の交点をd、線分TSと線分T1S1の交点をeとする。三角形Sed上のQは常にQ1より上にあります。
 逆に四角形AdeT上のQは常にQ1よりも下にあります。
  図2と図4を重ねると下図(図6)のようになります。
 (図6)
  線分USと線分U2S2の交点をf線分UTと線分U2T2との交点をgとする。三角形U2fg上のQ2は常にQより上にあります。
 逆に四角形fS2Tg上のQ2は常にQよりも下にあります。
  今度は図2図3図4を重ねます。この時の線分deと線分fgの交点をQoとします。まず点Pを打った時PQ、PQ1、PQ2の長さの大小関係に注目します。
 それがPQ1≧PQ2≧PQだったとします。
 すると、これはプレイヤーAの利得の期待値がプレイヤーBの戦略のとりかたによってPQ1-PQ変動することを意味します。
 プレイヤーAの利得の期待値の最低値を保障水準と呼ぶとこの場合の保障水準はPQ-6となります。
  また、PQ1≧PQ2≧PQの時Qを点Qoに直線的に近づければ保障水準を上げることができます。
 PQ2≧PQ≧PQ1やPQ≧PQ2≧PQ1であっても同様に点Q1を点Qoに直線的に近づければ保障水準を上げることができます。
  点Pから三角形STUへ垂直に伸ばした直線上にある三角形STU上の点QがQ=QoとなるようなPをPoとします。
 同じく、QがQ=dとなるPをdo QがQ=eとなるPをeo QがQ=fとなるPをfo QがQ=gとなるPをgoとします。
 上述議論によってPo以外のPは最適戦略となりません。したがって、Poが最適戦略となります。
  次にPoの座標を求めます。
  まず線分ABに対する線分Adoの割合、Ado/ABを求めます。12t+3(1-t)=6(1-t)(0≦t≧1)t=1/5 
 線分CBに対する線分Ceoの割合Ceo/CBは、        12t+6(1-t)=9(1-t) (0≦t≧1)t=1/5
 この結果によってACとdoeoは平行である事が分かり、PoからACへの垂直線の長さは1/5である事が分かります。
  線分BAに対する線分Bfoの割合Bfo/BAは、       3t+12(1-t)=12t+6(1-t)(0≦t≧1)t=2/5
  線分CAに対する線分Cgoの割合Cgo/CAは、       3t+6(1-t)=12t(0≦t≧1)t=2/5  
 この結果によりBCとfogoは平行である事が分かり、PoからBCへの垂直線の長さは2/5である事が分かります。
 また、PoからABへの垂直線の長さは、1-1/5-2/5=2/5 よって2/5となります。
  これにより、グリコのゲームの最適戦略は[グー、チョキ、パーをそれぞれ2/5、2/5、1/5の割合で出す。]となります。


                                                          トップページへ