【読書ノート】『ルールに従う』第1章

合理性について勉強する必要があってセンの『集合的選択と社会的厚生』をちびちび読んでいるのだけど、ヒースの方も読む必要がありそうなので並行的に読んでいく。実は再読。でも例によって脳が悪いのでだいたい忘れてる。

第1章 道具的合理性

イントロ

ホッブズは理性を道具として捉えている。つまり、信念と欲求から最善な行為を導き出す「道具」として理性が捉えられているのだ。それぞれの概念の関係は以下のような感じ。

  • 信念:事態を表象する
  • 欲求:表象された事態を評価する
  • 行為:事態を実現する
  • 理性:信念と欲求をデータとして望ましい結果をもたらす行為を特定する

ホッブズによると、信念は修正可能だ。たとえば、「雨が降ってる」という信念を抱いた人は、窓から外を見たときに「雨が降ってない」という風に信念を修正するかもしれない。

だけど、欲求は修正できない。というのは、欲求に対しては理性が働かないから。なぜ理性が働かないかというと、欲求は外部のものごとについて何かを説明するものではないから。だから、「正しい欲求」とか「誤った欲求」とかは無いわけで、正しくも間違ってもないのだから理性で修正するようなものではない。

で、道徳的判断は欲求にもとづくものだとも言える。「Aのようにするべきだ」という道徳的判断は、Aが実現されるのを欲求しているということでもある、というわけだ。だとしたら、道徳的判断は理性でコントロールするようなものではない1。これが道徳的判断に関する非認知主義というやつだ。

この道徳的判断に関する非認知主義自体は理性が道具的だという話と直接関係ない。非認知主義は、あくまで信念とか欲求とかが修正可能かそうでないかという話。で、そういう修正プロセスが済んだとして、信念と欲求にもとづいて行為を選択する、というのが理性が道具的だということの意味。

1.1 意思決定理論

こういう風に理性を道具として捉えるホッブズの発想は現在の意思決定理論にそのままつながっている。現在の意思決定理論では「行為」「状態」「結果」を意思決定の要素と考えている。「状態」は「状態に対する信念」として、「結果」は「結果に対する欲求」として、それぞれ「信念」「欲求」に紐付いている。

信念は常に確実だとは限らない。たとえば「明日雨が降る確率は40%だ」という信念を持っていることもある。そういうときは期待効用を最大化するように意思決定する、という風に意思決定理論では考える。たとえば効用と確率が下の表のようになっているとすると、傘を持っていくときの期待効用は8×0.4+6×0.6=6.8で、傘を持っていかないときの期待効用は0×0.4+10×0.6=6.0だ。だから、傘を持っていった方がいい、ということになる。

傘を持って行くときの効用 傘を持って行かないときの効用 確率
明日雨が降る 8 0 0.4
明日雨が降らない 6 10 0.6

ふうん、でも、効用ってなに? 8とか6とか、誰が決めたの? ドーパミンが8リットル脳内に溢れてきて目汁と一緒にボタボタこぼれ落ちるとかいう話? もちろんそんなわけない。

こう考えてみてくれたまえ。Aさんにとってのオレンジとリンゴの効用を評価したいとする。Aさんが次のようなクジとオレンジを比較するとする。このとき、もしAさんが「どっちでもいいです」というとしたら、Aさんにとって、オレンジはリンゴの70%の価値を持つことになる。

  • 選択肢1:70%の確率でリンゴをもらえるクジ
  • 選択肢2:オレンジ

さて、こういう風に定義された効用は、ドーパミンとかと何の関係もないのは明らかだ(そのあたりがホッブズとはちがう。ホッブズの考える「欲求」というのはもっとドーパミン的なものだ)。

また、効用に「2」とか「8」とか数字を割り当てるのは恣意的だというのも明らかだろう。リンゴの価値が10ならオレンジの価値はその70%の7となる。しかし、リンゴの価値を100としてオレンジの価値を70としても何も問題はない。大事なのは70%という効用間の比率であって、数字の大きさそのものは意味がない。

となると、効用を個人間比較することもできないことになる。Aさんはリンゴの価値に10を割り当てるかもしれないし、Bさんは3京を割り当てるかもしれない。これを個人間比較すると、「Bさんの方がリンゴを高く評価している」という風になってしまう。でも、Aさんが効用の基準値にどんな数字を割り当てるかは恣意的なのだから、Aさんはリンゴに1恒河沙を割り当てたって構わない。でもそれで「Aさんの方がリンゴを高く評価している」と判断をひっくり返すのは阿呆なことでしょう。

1.2 フォン・ノイマン=モルゲンシュテルンの手続き

フォン・ノイマン=モルゲンシュテルンの場合は、主体は序数的な選好を持つという風にだけ仮定する。つまり「オレンジよりリンゴの方が好き」みたいに、価値あるものの順番だけ評価するのだ。で、選好には次のような制約がかけられる。

  • 完備性:選択肢aとbがあるとしたら、aがbより弱く選好されるかその逆かのどっちか。
    • 「弱く選好」というのは、aもbもどっちも同じくらい選好するケースも含む、ということ。イコールのついた不等号(≧)みたいなの。
  • 推移性:aがbより弱く選好され、bがcより弱く選好されるなら、aはcより弱く選好される。

こういう序数的選好から基数的効用関数(つまり、選好の順序だけでなくて、選好の強さも含む関数)を求めるには、さらに4つの仮定が必要となる。「複合クジの還元」「単調性」「連続性」「代替可能性」だ。それぞれの意味を知りたいなら本を買ってくれたまえ。

1.3 社会的インタラクション

さて、ここまで見てきた意思決定理論の枠組みでは、信念は選択においてすでに決まっているものとして扱っていた。つまり、「明日雨が降る確率40%」みたいに信念を固定した上で期待効用を最大化するように行為を決定するという枠組みだったわけだ。

だけど、人々の相互作用を考えると、この信念自体がうまく固定できなくなってくる。たとえばAさんとBさんの2人で構成されるミニ社会を想定しよう。この社会で電力需給が逼迫しているときに、あなたが節電をすることで停電を回避できるかどうかはわからない。というのは、停電を回避するにはBさんも節電に協力しないとならないから。しかし「降水確率40%」みたいなノリで「Bさんが節電に協力する確率は40%」という風に信念を固定することはできない。なぜなら、Bさんが節電に協力するかどうかは、Aさんの行為にも影響されて決まることだからだ。卵が先か鶏が先かみたいな話になってくるのだ(信念が先か行為が先か)。

ゲーム理論はそういう「信念」の均衡に注目する。たとえば次のような利得表を考えよう。

L M R
U (2, 5) (3, 4) (1, 3)
C (1, 3) (4, 2) (2, 1)
D (0, 2) (2, 7) (8, 4)

それぞれのセル内の数字は(プレイヤー1の利得, プレイヤー2の利得)という風に読んでくれたまえ。

プレイヤー2(列プレイヤー)にとって、プレイヤー1(行プレイヤー)がどの選択をしようと、RよりもMを選択した方が利得が大きい。こういうとき、MはRを支配しているという。で、プレイヤー2にとってRを選択するのは全く無意味なわけだから、利得表から削除してしまってもかまわない。すると利得表はこんな風に小さくなる。

L M
U (2, 5) (3, 4)
C (1, 3) (4, 2)
D (0, 2) (2, 7)

で、今度はプレイヤー1について見てみると、プレイヤー2がどんな選択をしようとDよりCを選択した方が利得が大きい。同じように、Dを削除することができる。こういう風に、支配されている戦略をガンガン削除していくと、最終的には左上の(2, 5)というセルだけが残ることになる。つまり、これがお互いの戦略に対する信念の均衡点ということになる(プレイヤー1は「プレイヤー2は戦略Lを選ぶだろう」という風に信念を固定できるし、プレイヤー2は「プレイヤー1は戦略Uを選ぶだろう」という風に信念を固定できる)。

なるほど。じゃあ支配されてる戦略をガンガン削除してけば、信念を固定できないという問題は回避できるのですね? そうとは限らない。次のような利得表では均衡が2つあって(つまり、(3,1)と(1,3)のセル)、どっちが選択されるかわからない。つまり、信念を固定できないことになる。

L R
U (3, 1) (0, 0)
D (0, 0) (1, 3)

じゃあ、混合戦略を使ってみたら? つまり、Uを選ぶかDを選ぶかという2択の問題として考えるのではなく、Uを70%の確率で選択してDを30%の確率で選択するという風に確率を取り入れる。でもこれも問題がある。というのは、混合戦略を取り入れるとかえって均衡の数が増えてしまいがちだからだ。

また、混合戦略を取り入れるともっとへんな問題も発生する。それは、信念は固定化できるけれど、実際にどう行動すれば良いかを決められない、というものだ。次のような純粋戦略均衡の無いゲームに混合戦略を適用してみよう。純粋戦略均衡が無いというのは、どのセルであっても片方のプレイヤーは戦略を変えることで自身の利得を高めることができるということ。利得を高めるためにお互いに戦略を変え続けるので均衡に至らないのだ。

L (q) R (1-q)
U (p) (3, 0) (1, 3)
D (1-p) (0, 3) (3, 1)

pとかqとか付いてるのは混合戦略であることを意味する。たとえばプレイヤー2(列プレイヤー)は、確率qで戦略Lを選択し、確率1-qで戦略Rを選択する。このとき、プレイヤー1(行プレイヤー)はプレイヤー2に対してどういう信念を持てばいいだろうか? 

戦略Uを選択したときのプレイヤー1の期待利得=3×q + 1×(1-q)= 2q + 1

戦略Dを選択したときのプレイヤー1の期待利得 = 0×q + 3×(1-q) = 3-3q

これらの期待利得は等しくなる。なぜなら、どちらかがより大きいとしたら、プレイヤー1はその大きい方の戦略「だけ」を選択するはずだから。それはつまり混合戦略ではなく純粋戦略を採用するということだ。だけど今は、純粋戦略均衡が無いから混合戦略を導入しようという話の流れなのだから、純粋戦略を採用してはいけない。したがって、期待利得は等しくないとならないことになる。

で、そうやって上の2式をイコールで結んでqについて解くと、(q, 1-q)=(2/5, 3/5)となる。これが、プレイヤー1がプレイヤー2の混合戦略について抱く信念だ。やった、信念を固定化することができたぞ! プレイヤー2についても同様に、プレイヤー1の混合戦略についての信念を固定化することができる。

だけど、こうやって信念を固定化するときに行った計算では、戦略Uを選ぼうと戦略Dを選ぼうと期待利得は等しいという風に考えた。だとすると、そもそも戦略を選ぶということ自体がどうでもいいことになってくるわけだ(だってどっちでも同じなんだから)。だから、プレイヤー1は実際にどんな戦略をとればいいか決められなくなる。プレイヤー2についても同様だ。こんな風に、混合戦略を導入すると、信念は固定化できるけれど行動は決められない、という阿呆なことになってしまうのだ。

均衡が複数あるゲームを解くために、混合戦略以外にもいろんな解決策が提案されたけどどれもうまくいってない。どうも、道具的合理性で解決しようとすると、均衡が決められなくなってしまう「非決定性問題」が発生してしまうみたいだ。なんてこった。孤立したひとりの人が意思決定するときは道具的合理性でうまくやれてたのに、人々の社会的インタラクションを考慮に入れると途端にうまくいかなくなってしまうのだ。

1.4 秩序の問題

ゲームの均衡がつねにパレート最適であるとは限らない。囚人のジレンマを考えてみよう。

L R
U (2, 2) (0, 3)
D (3, 0) (1, 1)

このゲームの均衡は右下の(1, 1)だ。だけど、左上のセルの利得は(2, 2)だ。だから、(1, 1)にいるのなら、どちらのプレイヤーの状態も悪化させることなく両者の状態を改善することができる。したがって、(1, 1)はパレート最適でない。なのに均衡になっている。これはプレイヤーの数が2人でなくても生じうる問題だ(大勢のプレイヤーで発生する場合は「共有地の悲劇」となる)。

つまり、道具的合理性で問題解決しようとすると、信念が固定化できなくなるとか、信念は固定化できても行動を決められなくなるとか、信念も行動も決められるけどパレート最適でない均衡になってしまうとか、いろいろへんなことになってしまうのだ。

だけど、こういう風に数理的にゲームを解くのではなく、心理学的アプローチで実験ゲームをやってみると、案外人々は協力したり互いに調整(コーディネーション)したりするというデータが得られるものだ。人々はいったいどういう資源を使って問題解決してるんだろう? そしてそれはゲーム理論に実装できるものなんだろうか? もしできないとしたら行為のモデルは非道具的な熟慮を組み込むために拡張されるべきだということになるだろう。

1.5 結論

どうも、そもそもの仮定がおかしかったんじゃないだろうか? 

意思決定理論は、社会的インタラクションのないロビンソン・クルーソー的な状況を仮定して作られたものだ。でも、それが社会的インタラクションのある状況にも通用する、と考える方が無茶なんじゃないだろうか?

だいたい、人間はまず社会的インタラクションの中で育つわけでしょう。別に、ボールとかテーブルとかの扱い方を覚えてから、そこで覚えたノウハウを母親とか父親に適用する、なんてことをやってるわけじゃない。それでは順番が逆だ。

だから、実践的合理性の理論をつくりたいのなら、まずは社会的インタラクションの構造分析から始めるべきだ。残念なことに、経済学者たちの多くは合理性の限界にぶち当たると、合理性という前提自体を捨ててしまいがちだ。だけどそんなことしなくていい。むしろ、合理的行為のモデルをきちんと考え直すべきなのだ。

感想

難書だと思ってたけど、こうやってまとめながら読むと案外読みやすい。論理展開がシンプルで変な脱線がないのがありがたい。この調子で完走したいけど…。


  1. 前にサイモンの本でも価値の問題に対して理性は無力だみたいなことが書いてあったけど、サイモンも道徳的判断に関する非認知主義だということなのかな。