ということで、「報酬系という装置」についてのまとめに入ろう。いずれも思考実験の結果である。(私の頭の中で、あれこれCエレ君を動かしてみた。)
報酬系とは、生物が生き残るために必須の装置である。報酬系はそれなりに複雑な仕組みを備えなくてはならないが、それは自然界が複雑だから仕方がないのだ。
私は生物自体は非常に単純化して、生命維持に必須な要素(Cエレ君にとっての電気に相当)を摂取し、危険(外敵、捕食生物など)を回避するというだけの条件を付けた。ただし生命本来の性質である「動き回る」は付け加えた。これは植物とは異なることを意味し、植物には報酬系は必要がない、ということになる。実はこの点は面白い。生命体は、動き回るという条件を外しただけで、報酬系を必要としなくなるのである!!
自然界の複雑さが報酬系を発達させたというのが私の主張だが、どういう意味での複雑さか?まず報酬が動き回る。大概相手もまた生命体であることが多いからだ。そして外的もまた動く。これが決定的に報酬系の働きを複雑にするのだ。その結果として「予測」はやはり決定的な要素となる。報酬や(外敵により被る)苦痛をどれだけ予測できるか、どれだけそこに動いていき、あるいはそこから遠ざかる事が出来るかが、生存にとって極めて重要となる。というか全てと言ってもいい。その結果として生命体はどうしても記憶装置が必要となる。ただしそのために人間が持っている海馬や扁桃核は必ずしも必要ではないだろう。ニューラルネットワークを与えておいて学習させればいい。ただしその結果として報酬系は遠くにある報酬や外敵に力価(ないしは「期待値」)を与える事が出来なくてはならない。なぜならばエサを求めて進むか、途中に待っている外敵のために遠ざかるか、という決定を各瞬間に迫られているからだ。「どっちにしようかな…」と留まることは、死を意味してしまう。
少し別のまとめ方をしよう。自然界にあるもっとも単純な生命が生存する条件を考えた結果、次のようなプログラム(≒報酬系)を備えていることが分かった。生命保持のために摂取すべきものや、生命を脅かす外敵を、予測する能力。それに従って進むか、退くかを決定して実行する能力。以上である。ただし実は、このモデルは、生命体に関してとんでもない単純化をしていることになる。つまり繁殖を省略しているのだ。生命体の変化、複雑化に、実は生殖は絶対的に重要な意味を持つ。生存より、子孫を残して死ぬ方が意味があったりする。繁殖は、種全体としての生存、と言い換えてもいい。
以上の思考実験で面白いと思うのは、生命体を動き回り、えさを求め、敵を回避するものとして考えた場合、そこに感情、痛み、喜び、快感などの必要性がどうしても生じてこないということである。その生命体は報酬を獲得している最中はじっとそこにとどまったり、痛みからは急いで遠ざかったり、遠くの報酬に向かって進んだり、という複雑な運動を必要とする。しかし主観的に快や不快を体験するかは、どうだっていいということだ。この思考実験は、その意味で意義深かった。