2023年10月15日日曜日

連載エッセイ 9 推敲 2

 快に関する共通経路説に対する反論

 ところがこの共通経路説はこの後反論に遭うことになる。それまでの定説が新たな事実と共にあっさりと、あるいはジワジワとひっくり返ってしまう。それが自然科学 natural science の醍醐味である。それはある実験がきっかけとなった。ケンブリッジ大学のウォルフラム・シュルツ Wolfram Schultz のグループは、サルの脳の報酬系に電極をさして、その部分の興奮の状態をもう少し詳しく調べようとした。まずサルにノズルを通して甘いシロップという報酬を与えてみる(リンデン,p.153)とサルの報酬系は興奮した。ここまでは予想通りである。そして彼はサルに電気信号を見せることと組み合わせた。まず緑の信号をサルに見せ、その二秒後にシロップを与えてみるという事を繰り返した。すると最初は報酬系はシロップが与えられた瞬間に興奮していたが、そのうち緑の光を見た時に発火するようになった。つまり緑信号を見た後に報酬が得られることを学習したサルは、その時点ですでに喜びを先取りするようになった。そしてここが肝心なのだが、二秒後に実際のシロップが与えられた瞬間には、報酬系の発火はもはや見られなかったのである。

  この実験結果に基づき、シュルツはドーパミン系に関する新しい理論を打ち立てた。ドーパミンは実は快楽物質ではなかった。予測した報酬が実際にどの程度得られたか、という予測誤差 reward prediction error に反応しているに過ぎないのだ。だからネズミは緑の光が点灯した時点で満足するが、その予想にたがわずシロップが得られたときは、予測通りであった(予測誤差がゼロであった)ためにドーパミンの興奮は起きなかったのである。

 この実験結果は多くの学者を悩ませることになった。実際にサルが快感を味わったのは、シロップを口にした瞬間のはずだ。でもその時にドーパミンの分泌に関係しないのであれば、ドーパミンの「最終共通経路説」は正しくないことになるのだろうか?予測通りシロップを味わったサルは嬉しくなかったのであろうか? これらの問題はあるものの、シュルツの予測誤差説は学界内に浸透していった。

 

 さらにもう一つ、共通経路説に対する反証となる実験が行われた。そもそも快感はドーパミン経路の興奮により得られるとしたら、脳にドーパミンが枯渇している場合には快感は得られないはずである。しかしドーパミンなしでも、報酬を得た際の「おいしい」という感覚は問題なく体験できるということが分かったというのである(page 2, Berridge, 2017)。もちろんネズミは「おいしい」とは言わまいが、顔の表情が弛緩し、舌や口がリズミカルな動きを示すことでそれはわかるのだという。つまり脳の中に報酬系とは別の部位Xがあり、そこでドーパミンの代わりに何らかの物質が働いて私たちは心地よさを味わうのだと考えられるようになった。

 こうしてドーパミンの「最終共通経路説」は全面的に否定されたことになったのだ。ちなみにこれらの発見に大きく貢献したのがケント・ベルッジの「インセンティブ感作理論 incentive sensitization model」 (略してISM理論)であった。


報酬の二重帳簿問題


このISM理論は「最終共通経路説」の含む矛盾を説明する説として現在注目され、私自身もその大枠に納得しているものである。まず大前提として私たちは快を求め、不快を回避する。通常は生命体の維持に役立つ物やことがらは心地よく、害になるものはその逆であるから、この仕組みは概ねにおいて役立っている。そして幸いなことに、通常は快は無限に得られるわけではない。

 ネズミにとっての甘いシロップの代わりに、人間にとってのチョコレートを例にあげよう。私達の多くはチョコレートのような甘いものを好むが、それを永遠に貪るわけにはいかない。それにはいくつかの理由がある。はるか昔の文明開化の頃なら、チョコレートは舶来の貴重品で、簡単に手に入れることなどできなかっただろう。今では安価になりコンビニでどこでも手に入るようになった。でも私たちの多くは「甘すぎて食べていると頭が痛くなる」とか「ダイエットしているからこれ以上ダメ!」といって自らにストップをかける。このように好きなものには飽きが来るのが普通だ。快の源は一定の範囲でしか私たちを惹きつけないのである。

あるいはジョギングなどの運動でもいい。適度のジョギングを快適に感じる人は多いであろう。しかし30分も走れば息が上がり、もういい加減にやめて家に帰りたくなるだろう。(私は3分でもうたくさんである。)

 ところが私達は何事かに「ハマる」とか中毒になるという状態を時々経験する。お腹がはちきれそうになってもチョコレートなどのお菓子を止められなかったり(過食症)、体は悲鳴をあげながらもジョギングを止められなかったりする(いわゆる「ランナーズハイ」)という事が起きる。それはなぜなのだろうか?

 この問題を追及したベルッジらは、私たちの報酬には二種類あると理解することが出来ると考えた。報酬はいわば二重帳簿なのだ。一つはそれに携わっている時の心地よさだ。これは「好き like 」という感覚(これを以下にLと表現しよう)。チョコレートを美味しいと感じ、ジョギングを気持ちいと感じている感覚だ。そしてもう一つはそれを強く求めたり、止められなかったりする感覚。これを彼らは「求める want」ことと言い表した。こちらは以下に「D」としよう。(なぜWでなくてDにするかは以下に述べる。)

通常ならLとDは一致している。つまりチョコレートやジョギングは心地いい分だけそれを続けたくなる。それに飽きて楽しくなくなってきたらそれ以上続けたくなくなる。つまりL=Dが成り立っている。ところが過食症やランナーズハイではこの二つにずれが生じる。つまり楽しさ、心地よさが減って来てもDは引き続き高いままであるという状態である(D>L)。通常ならD=Lの成立により私たちの生命を支えてくれるドーパミンシステムがどうしてこのようなことになったのか。そしてそこにドーパミンシステムによる報酬系の誤作動の問題について論じなくてはならない。