サイモン「合理的選択と環境の構造」

Herbert A. Simon, 1956, "Rational Choice and the Structure of the Environment," Psychological Review 63 (1956), pp. 129-138; reprinted in: Models of Man, Wiley, 1957, pp. 261-

イントロ

  • 合理的選択(決定の合理性)は最近、心理学と経済学の共通の関心対象になっているよ。
  • でも心理学の学習理論(満足化)と較べて経済学の最適化モデルは前提が強すぎるよ。
  • じゃあ、説明力を落とすことなく、どのくらいまで仮定する選択メカニズムを単純化できるかな。
  • この論文では、有機体の方じゃなくて環境の方の単純化について考えるよ。環境っていうのは客観的な世界のことじゃなくて、有機体の生活空間という意味の環境だよ。

有機体の環境

  • 食物を求めて、休息・探索・摂取をする単純な有機体を考えるよ。生活空間は平面で、そこいらに食物が落ちているよ。「餓死しない」というのが解決すべき問題だよ。
  • 合理的選択は(a)まずは食物を求めて出鱈目に探索する、(b)見つけたら直進して摂取する、(c)探索と摂取に必要なエネルギー消費量が、食事で摂取したエネルギーよりも小さい場合は休息できる、というもの。
  • 何が単純かというと、(1)目標が一つ(食物)しかない、(2)最大化でなくて満足化(餓死しなければいい)、(3)食物の分布がランダムなので探索パターンもランダムでよい、(4)手段と目的を完全分離可能、ということ。

知覚能力、蓄積能力、生存

  • 前節の話をformalizeするよ。
  • 生活空間を迷路と考えるよ。ある分岐点を選んで次の分岐点に着くまでを「移動」1回と数えるよ。食物はどこかの分岐点にあるよ。
  • 全分岐点のうち、食物のある分岐点の割合を p とするよ(0から1までの実数)。1つの分岐点に平均 d 個の分岐があるよ。有機体は v 回移動した先まで見通せるよ( v 回先に食物が見えたらあとはそこに向かうだけ)。食べてから H 回移動するまでにもう1回食べないと死んじゃうよ。
  • ある点から見たとき、1回移動した先には d 個の分岐点が見え、2回移動した先には d^2 個の分岐点が見えるよ。 v 回先まで見通せるということは、どの点からも d + d^2 + \dots + d^v = \frac{d}{d-1}(d^v-1) 個の分岐点が見えるということだよ。
  • 可能な移動は H 回だけど、見えてから辿り着くまでの移動回数 d 回を考えると、探索に使えるのは H-d 回だけだよ。
  • 1回移動すると新しく d^v 個の点が見えてくるけど、その中に食物がない確率を \rho とすると、1つの点にない確率が 1-p だから、d^v 個の点のどれにもない確率は \rho=(1-p)^d^v だよ。
  • 死ぬ確率 Q は、H-d 回の移動で食物が見つからない確率だから Q=\rho^{(H-v)}=(1-p)^{(H-v)d^v} だよ。生存確率は死なない確率ということで P=1-Q と書くことにするよ。
  • こうして見ると生存確率は、環境の側の条件である食物の豊富さ( p )と分岐の多さ( d )と、有機体の側の条件である知覚能力( v )と蓄積能力( H )で決まることがわかるね。
  • 具体的な数値を入れてみよう。食物のある確率を p=0.0001 にして、1つの点から平均10本の分岐が出ていて、探索に使える移動数を H-v=100 とし、見通せる移動の数を v=3 とするよ。これで計算すると、餓死する確率は大体1万分の1になるよ。ここで探索に使える移動数を3割アップして H-v=133にすると、餓死確率は大体10万分の1まで減るよ。

三谷メモ

少なくとも初版だと、ここの数値は間違っている。1万分の1が10万分の1になるだけなのに、10^{-4}10^{-40} になるとか書いている。

  • 上の話は  v 回先まで見通してから移動するという、ある程度合理的な選択の話だったけど、もし全然見通さないで見つかるまで出鱈目に歩く場合はどうなるかというと、移動可能な100回のうちに食物が見つからない確率は (1-p)^{100} だから p=0.0001 だと99%餓死するよ。見通して移動するということがどんだけ重要かわかるね。
  • ほぼ確実に生き延びるために蓄積能力 H が最低限どれだけ必要か考えてみるよ。生存確率 Pを1にすごく近い値 P\ge1-\epsilon に固定するよ( \epsilon\ge1-Pだよ )。 1-P=Q=\rho^{(H-v)} だから対数をとって \log (1-P)=(H-v)\log \rho となるよ。てことは \log \epsilon\ge(H-v)\log \rho だから H\ge v+\frac{\log\epsilon}{\log\rho} となるよ( \rho は確率で1より小さいから \log\rho は負になることに注意してね)。これで H の最小値がわかるね。
  • たとえば1回の移動で食物が見つからない確率を \rho=0.95 として、\epsilon=10^{-10}(つまり餓死する確率が100億分の1以下)として計算すると、探索に使える移動回数は H-v=455 以上でないといけないということになるよ。

つづく(ちっとめんどくさくなってきた)