2025年6月14日土曜日

遊び 推敲の推敲 6

 ではじゃれ合いが予測誤差の最小化につながるのか。

では実際のジャレ合いの場を想定しよう。

じゃれ合いではまず一方(Aとする)は相手を殴ると見せかける。ガオーっと襲い掛かるのだ。相手(Bとする)はこいつは本気で殴っては来ないと高をくくってくる。なぜならそのようなことは一度も起きていなかったからだ。そしてこれまでのパンチのやり取りの経験から、結局は「わざとパンチを逸らす」が100%起きるということが分かれば、そう予測することで予測誤差ゼロになり、殴り合いは遊びの要素を失ってしまう。ところがここで20回に一度ほど、「わざと軽く当ててくる」ということが起きるようになったとする。AかBがそれを最初に初めて、お互い時々それをやるようになる。最初はこれはお互いにヒヤッとし合うのは、拳が真正面に向かってくるからだ。「危ない」と一瞬思う。さてもしこの20回に一度という確率が変わらないなら、予測誤差はどうなるか。実は常に存在する可能性が有る。それは20回に一回の「そっと当ててくる」がいつ起きるかが分からない場合だ。
皆さんはランダムに報酬を与えられた際に一番それが嗜癖につながる、という原則をご存じだろう。レバーを押すと5%の頻度でシロップが出てくるとしよう。それが規則的に起きる際、例えば19回押すと水だけ出てくるが、次の一回はシロップが出てくる、というパターンが出来ると、それは嗜癖にはつながらない。意外性がないからだ。いつ、その二十分の一の出来事が起きるかが分からないから、スリルや期待があり、ラットはレバーを押し続けるのだ。

さてこの「わざとパンチを逸らす」という95%、「わざと軽く当ててくる」が5%というじゃれ合いは、しかしはあまり面白みがなくなってしまう。なぜならわざと軽く当てるパンチは痛くなく、安全であることを学習すると、結局は強いパンチはAからは繰り出されないことは分かっているからだ。どちらも侵襲性がない、という意味では「痛くないパンチが来る」確率は100%になってしまい、予測誤差ゼロで面白みも全くなくなる。