2016年8月9日火曜日

推敲 6 ②

遂行システム

以上のべた探索システムは、私たちが第3章で考察した「報酬勾配」という概念と深い関連がある。探索システムとは、そこに報酬勾配を見出し、作り上げるシステムということが出来るだろう。そしてこれはごく原始的な生命体にも見られるものと考えることが出来る。ただし実際の私たちの生活で、報酬勾配が私たちの行動を裏付けることはさほど多くないかもしれない。たとえば塩分濃度や光子の数などの物理的な裏づけに従って私たちが動かされることは決して多くないだろう。すでに何度も出てきた例だが、炎天下を歩き続けて渇きに苦しんだ人が、100メートル先の清涼飲料水の自動販売機を目指して歩く時、一歩ごとにのどが少しずつ潤う、ということは起きようがない。
結論として言えば、実はここにも仮想的な報酬勾配があるのだ。生命体は将来現実に体験するであろう快の総量を想定し、それに向かっていく行動自体が快なのである。あたかも想像上の快の水路づけがなされるのだ。少し具体的に見てみよう。
あなたは炎天下でのどの渇きを感じ、水分の補給を望んでいたが、どこにも手に入れるあてがなった。そして100メートル先に自動販売機を発見する。手持ちの小銭は十分にある。「やった!」とあなたは喜びを体験する。そしておそらくその時点で、実際に体験する快の全量を大まかに査定するだろう。あなたは自販機でたいていは売っているはずの冷たいお茶やミネラルウォーターを想像し、それが今ののどの渇きを十分にいやしてくれることを想像する。その際に予想される快の量をたとえば10単位としよう。次にあなたは、それを確実に獲得するためにしなくてはならないことは何かを考える。自販機に確実に行き着くまでは100メートルほど歩く必要がある。幸いそのくらいの体力は残っている。またその距離を歩く際に特別な危険とか労苦を覚悟しなくてもよさそうだ。平和な日本の街角で、突然トラやコブラに襲われることなどない。とすれば10メートル歩けば、水を10%確実に手中にしたと考えてもいいだろう。次の10メートルも・・・・。
ここでなぜ一歩一歩が快を提供するのか、という疑問は先送りにしよう。ともかくも生命体が将来の快を想定し、そこに向かって歩むというプロセス自体を快としてみずからを導くようなシステムを作り得ていることは確かなことである。
あるいはこんな例を考えてみる。ライオンの集団が、バッファローを狙う。群れから離れたまだ子供の一匹のバッファローに狙いを定め、雌ライオンたちがジワッと取り囲み、茂みに隠れながらとびかかるチャンスをうかがう。リーダー格の雌ライオンが突然飛び出してバッファローに襲い掛かり、背中に飛び乗る。他のライオンたちがそれに続く・・・・。最後にバッファローは倒れ込み、哀れ餌食となる。
彼女たちの頭にもおそらくペットボトルを求めて歩みを続ける私たちと同様のことが起きている。美味しそうなバッファローの子供。それを目にした時点ですでに彼女たちの頭の中では、みずからの牙がその柔らかそうな腹を食いちぎって肉をむさぼっているはずだ。しかしそこに到達するためには遂行しなくてはならないことがあることも知っている。そして一連の、統制のとれた行動を起こす。その一つ一つのプロセスに彼女たちは興奮し、スリルを味わっていることだろう。
ここで私は「遂行システム execution system 」という概念を提案する。パンクセップの探索システムを拡張したものである。私たち人間は(高等な哺乳類も入るだろうが)ある種の行動の遂行を、それが最終的に約束してくれるであろう快を含めた一続きの行動として行うよう運命付けられる。のどの渇きを耐えて歩いてきた人が一本のミネラルウォーターを差し出されると、「やった!」とドーパミンのニューロンが発火する。脳はその全量を大まかに査定すると同時に、それを確実に得るために行わなくてはならないプロセスに伴う労苦の量を算出する。すると今度はそれを獲得するための行動それ自体が、そのプロセスも含めて報酬につながる。そして報酬系はその完遂を見届けるようなシステムを備えているはずだ。あるいは言い直そう。そのようなシステムを身に着けた生命体こそが、生き延びることが出来たのである。
 もちろんそれが可能な生命体は限られているであろう。たとえばシャチは集団で流氷上のアザラシを襲う。そろって一斉に動いて波を起こし、アザラシを流氷の上から引きずりおろすのだ。そのような手の込んだ真似は、サメにはムリであろう。しかしサメは単独で深いところに潜んで、海面近くの魚を待ち伏せして襲う。その程度の遂行は可能なのだ。より複雑な行動を遂行するうためには、それだけ複雑な遂行システムが必要となろう。