2008 岩手県立大学 前期総合思考力試験IIMathJax

Mathematics

Examination

Test

Archives

2008 岩手県立大学 前期総合思考力試験II

ソフトウエア情報学部

易□ 並□ 難□

【1】 次の文章を読んで,あとの問いに答えなさい.

 ゲーム理論という学問分野があります.ゲーム理論の研究は, 1944 年に出版されたフォン・ノイマンとオスカー・モルゲンシュテルンの著書『ゲームの理論と経済行動』が始まりであるとされています.

 ゲーム理論の中でも有名なものに「囚人のジレンマ」と呼ばれる問題があります.ここでは,このジレンマの問題を,プレーヤー A とプレーヤー B の二人で行うゲームとして,以下のように設定します.

・プレーヤー A とプレーヤー B はそれぞれ「協力」か「裏切り」のどちらかを選択する.

・二人とも協力を選択した場合,それぞれに 300 円の報酬が与えられる.

・一人が協力,一人が裏切りを選択した場合,協力を選択した方には 100 円,裏切りを選択した方には 500 円の報酬が与えられる.

・二人とも裏切りを選択した場合,それぞれに 200 円の報酬が与えられる.

・プレーヤー同士はどちらを選択するか相談してはならない,すなわち,相手が協力と裏切りのどちらを選択するかは分からない.

・ゲームの目的は相手に勝つことではなく,自分ができるだけ多くの報酬を獲得することである.

 このようなゲームで各プレーヤーが得ることができる報酬をゲーム理論では利得と呼び,各プレーヤーの選択ごとの利得をまとめると表1のようになります.括弧内の数値の対が二人のプレーヤーの利得で,左側がプレーヤー A の利得,右側がプレーヤー B の利得を表す数値です.

表1:プレーヤー A B の利得

B の選択

A の選択

協力

裏切り

協力

(300 ,300) (100, 500)

裏切り

(500, 100) (200, 200)

 このとき,各プレーヤーはどのような選択をすることが最良かを考えてみます.プレーヤー A の立場で考えてみると,プレーヤー B が協力した場合,自分も協力すると利得は 300 円,自分が裏切ると利得は 500 円になります.また,プレーヤー B が裏切った場合,自分が協力すると利得は 100 円,裏切ると利得は 200 円となります.よって,プレーヤー B がどちらを選んだとしても,結局のところ,プレーヤー A は裏切りを選択した方が利得が大きくなります.プレーヤー B の立場で考えても同様の結果となるため,この場合,プレーヤー A プレーヤー B ともに裏切りを選択するのが最良の選択となります.このようにして決定される,お互いに最良となる選択の組み合わせのことをナッシュ均衡と呼びます.相手がナッシュ均衡の選択をしているときには,自分がその他の選択をしてもより大きな利得を得ることはできないのです.しかし,実際には,ナッシュ均衡である裏切りを二人ともが選択し,それぞれ 200 円の利得を得るよりも, ほうがお互いの利得が大きくなります.このように,全体のことを考えて協力し合えばよりよい結果になるはずなのに,個人個人が自分のことを考えると裏切りを選択することになってしまいます.

 以上のように,選択が一度きりのゲームでは裏切りを選択することが,最良の選択になることが分かりました.では,一度きりではなく,選択が繰り返し続くとしたら,利得の合計を向上させるために,お互いが協力を選択することはありえないのでしょうか.

 たとえば,ゲームにおいて選択を 3 回繰り返すものとします.まず,一番最後の選択である 3 回目にどのような選択をすればよいかを考えてみます.利得の合計は 1 回目と 2 回目の利得の合計と 3 回目の利得との和であり, 3 回目の利得は 1 回目と 2 回目の利得に影響されません.よって, 3 回目の選択においては,直前までにどのような選択をしたかにかかわらず,裏切りを選択することが自分の利得を最大にする最良の選択であることが分かります.同様にして考えていくと, 2 回目でも裏切りを選択し, 1 回目でも裏切りを選択することが最良の選択となります.結局,選択を 3 回繰り返すゲームにおいて自分の利得を大きくする最良の戦略は,常に裏切りを選択することとなってしまいます.

 これを実際に確認するため,このゲームにおいて,プレーヤー A 3 回とも裏切りを選択するという戦略を取った場合における,プレーヤー B の利得の合計を計算してみましょう.プレーヤー B 3 回の選択において,それぞれ協力,裏切りのどちらかを選択します.よって,プレーヤー B の戦略は全部で 通りあることになりますが,その利得合計は最大で 円,最小 円となります.つまり,常に裏切りを選択した場合に利得合計が最大となり,これが最良の戦略であることが分かります.繰り返しの回数をより多くして,(A)百回や一万回にしてもこの状況に変わりはありません.このゲームにおいて選択を繰り返し続けるときに,常に裏切りを選択する以外の戦略がよりよい戦略となるためには,じつは,繰り返し回数が無限,もしくはいつ終わるか分からないことと,現在の利得と将来の利得は等価値ではないという条件が必要です.

 現在の利得と将来の利得が等価値ではないということは,たとえば今持っている 10,000 円は,銀行に預けておけば利子がついて将来はより大きな金額になるということです.つまり,現在の 10,000 円は将来の 10,000 円よりも価値があると考えるわけです.現在の x 円に対して,一定(1)キカン T ごとに r % の利子がつくものとします.すると,現在の x 円は T が経過した後, x( 1+0.01 r) 円となります. 2T が経過した後には,この x (1 +0.01r ) 円がさらに 倍になりますから 円となります.よって,現在の x 円は n T が経過した後には 円となります.したがって,現在の x 円のほうが,将来の x 円より価値があるということができます.これは現在の価値が将来どのようになるかを計算していますが,逆に将来の価値を現在の価値に(2)カンサンすることもできます.この場合, nT が経過した後の y 円は,現在の価値で 円に相当します.ここで, D= とすると n T が経過した後の y 円は現在の y Dn 円となります.この D を割引率といい, D が小さいほど将来の価値の現在への割引が大きいということになります.この割引率を考慮することにより,お互いが協力するなど,常に裏切りを選択する以外の戦略が有効となる場合があるのです.

[問1] 本文中の下線部(1),(2)をそれぞれ適切な漢字で答えなさい.

[問2] 本文中の にあてはまる文章を30文字以内で答えなさい.

[問3]  にそれぞれあてはまる数値もしくは式を答えなさい.

[問4] 本文中の下線部(A)の理由を 100 文字以内で答えなさい.

[問5] ジレンマの問題で表現可能な事例の 1 つとして, 2 店のガソリンスタンドの価格競争があげられる.近隣の 2 店において,互いに他店の販売価格がわからないとした場合に,どのようなジレンマが生じるのか答えなさい.

[問6] 常に裏切りを選択する以外の戦略の有効性を考えるため,ゲームにおいて選択が無限に続くとした場合の利得合計を計算する.以下の文章を読んで,あとの問(a),(b)に答えなさい.

 ゲームにおいて選択が無限に続き,割引率が D であるときの利得の合計を計算してみます.ここで, D は以下を満たすものとします.

-1<D <1

 プレーヤー A プレーヤー B ともに戦略として常に裏切りを選択する場合,それぞれの利得合計は等しく,以下のようになります.

200+200 D+200 D2 +200 D3+

 このような数列の計算には次の公式が知られています.

1+x+ x2+ x3+ = 11-x (ただし, -1<x <1

 よって,この公式を当てはめると,利得合計は以下のように計算することができます.

200+200 D+200 D2 +200 D3+ = 2001-D

 これに対し,常に裏切りを選択する以外の戦略として「トリガ(引金)戦略」と「しっぺ返し戦略」という 2 つの戦略を考えてみます.トリガ戦略とは最初は協力し,以後,相手が協力している限り自分も協力するという戦略です.この戦略においては, 1 回でも相手が裏切れば,その後,自分は常に裏切りを選択します.相手の裏切りが引金となり,自分の選択が変化することから,このように呼ばれています.しっぺ返し戦略とは最初は協力し,相手が協力すれば次回は自分も協力する,逆に,相手が裏切れば次回は自分も裏切る,という戦略です.つまり, 2 回目以降は相手の前回の行動をまねるという戦略です.相手にしてみると,前回の自分の行動が,そっくりそのまま自分に返ってくることから,この名前がつけられています.

 プレーヤー A がトリガ戦略を選択し,プレーヤー B が常に裏切りの戦略を選択した場合を考えます.プレーヤー A の利得の合計は,以下のように計算できます.

100 +200D +200D 2+200 D3+

=100+D (200 +200D +200D 2+200 D3+ )

=100+ 200 D1 D

 同様にして,他の戦略を選択した際にも,利得の合計を計算することができます.

(a) プレーヤー A プレーヤー B がそれぞれの戦略を選択した場合における利得をまとめた結果を表2に示す. にあてはまる式をそれぞれこたえなさい.

表2:選択した各戦略における利得

B の戦略

A の戦略

常に裏切り トリガ しっぺ返し
常に裏切り ( 2001- D , 2001- D ) ( ,100+ 200 D 1-D ) ( , 100+ 200D 1-D )
トリガ (100+ 200D 1D , ) ( , ) ( 3001- D , 3001-D )
しっぺ返し (100+ 200 D 1-D , ) ( , ) ( , )

(b)常に裏切りを選択する以外の戦略がナッシュ均衡となるのは, D の値がいくつ以上のときか,分数で答えなさい.

2008 岩手県立大学 前期総合思考力試験II

ソフトウエア情報学部

易□ 並□ 難□

【3】 次の文章を読んで,あとの問いに答えなさい.

  A リーグと B リーグが存在し,それぞれ 6 チームから構成されている.各リーグ内では年間を通して試合が行われており,それぞれのリーグにおいて,ただ 1 つのリーグ優勝チームが決定する.そして,各リーグのリーグ優勝チーム同士が試合を行い,最終的に,ただ 1 つの総合優勝チームが決定する.このリーグ優勝チーム,および総合優勝チームを予想することにする.なお,各チームがリーグ優勝する確率,および各チームが総合優勝する確率は,すべて等しいものとする.

[問1] それぞれのリーグ優勝チームを,各リーグから 1 チームずつ予想する.このとき,少なくとも 1 チームが的中する確率を分数で答えなさい.

[問2] 総合優勝チームとして, A リーグの任意の 1 チームを予想したとき,これが的中する確率を分数で答えなさい.

[問3]  4 チームで構成される C リーグが新設された.この C リーグが追加された 3 リーグにおいて,それぞれのリーグ優勝チームを,各リーグから 1 チームずつ予想する.このとき,少なくとも 2 チームが的中する確率を分数で答えなさい.ただし, C リーグにおいても,ただ 1 つのリーグ優勝チームが決定し,また,各チームがリーグ優勝する確率はすべて等しいものとする.

[問4]  C リーグが追加された 3 リーグにおいても,リーグ優勝チームの中から,ただ 1 つの総合優勝チームが決定する.この総合優勝チームとして, C リーグの任意の 1 チームを予想したとき,これが的中する確率を分数で答えなさい.ただし, A B C リーグのリーグ優勝チームが総合優勝する確率 P A PB PC は以下のとおりとする.

PA = 25 PB = 25 PC = 15

inserted by FC2 system