2025年4月9日水曜日

AIはなぜ【心】を持ったのか? 1

 「アルファ碁ゼロ」という囲碁ソフトをご存じだろうか。その前のバージョンである「アルファ碁」は、2018年に囲碁のチャンピオンであった韓国のイ・セドルを打ち負かしてしまった有名なソフトである。ところがその進化版であるアルファ碁ゼロは、たった3日間の学習をしただけで、旧版のアルファ碁を100戦100勝で打ち負かしてしまったのだ。実に恐るべき実力である。  アルファ碁ゼロはなぜ短時間でそれほどの躍進を遂げたのか。それまでのアルファ碁とどこが違ったのか。それはアルファ碁ゼロは囲碁の定石とか有名棋士の棋譜とかを一切学習させずに、ただ2台のAIをお互いに高速で対戦させただけでその驚異的な実力を獲得したからだという。つまりそれは負けた場合に自己修正するということに特化したマシンだったのだ。  この例に示されるように、最新のAIは例えば囲碁のある局面のデータを、そこでの正解と組み合わせて覚えこませるという、いわば詰込み型で丸暗記の学習を取るのではない。ある局面で試行錯誤の手を打ち、それが敗着となった場合にそこから自己修正をして徐々に正解に近い答えを出せるようになるという、いわば自己学習を行うマシンなのだ。しかし考えてみれば、それは人類が囲碁を発見してから世界じゅうで人々が何千万回、何兆回となく対戦をして実力をつけていったのと同様のプロセスをたどったことになるのだ。ただし人間と違いAIは一度間違った手は二度と指さず、同じ間違えを繰り返すことをせず、しかもたったの72時間でそれを行ってしまうということである。  人は次のように思うかもしれない。碁盤に表れるあらゆる局面とそこでの正着を覚えこませる方がよほど手っ取り早いのではないかと。しかしそうはいかないのは、AIの歴史が教えてくれる。囲碁や将棋などのボードゲームは、その局面の数が限られているなら、上述の詰込み式でもある程度はなんとかなったのである。例えばチェスなら、ある局面を入力して正しい一手を教える、という詰込み型の情報を与えるだけで人間に勝てた。もちろん考えられる局面はものすごく多いけれど、何度か丸暗記の詰込み型で教えてプロに勝つことが出来た。それが1997年の話。  ところが囲碁や将棋となると局面が天文学的に増えて(例えばチェスに比べて局面が10の100乗倍多く)、その一つ一つに正解を教え込むことは事実上不可能となった。そこで考え出されたのが、コンピューターに自分で答えを考えさせて、自分で正解を見つけさせる方法(自己教師あり学習 self-Supervised Learning)。そのためには二つのAIを対戦させる方法を取ったのである。  ここで興味深いのは、最近のAIはデータ処理をする装置というよりは、学習する装置であるということだ。具体的には、質問が入力されて、それに対して答えを予想して出して、間違ったら中身を調整して少しでも正解が近いアウトプットが出来るようにする装置。そこで決定的に大事なのは、間違ってもいいから答えを出して、それを訂正されるという試行錯誤の繰り返しをするところだ。そしてそれは人間の脳と全く同じなのである。それはあみだくじに例えるならば、最初にランダムに入れられている橋げたであり、人間の場合は生まれた時に存在していた脳内ネットワークということになる。最初にランダムな状態があって、それが直されていくというプロセスが決定的に重要というわけだ。そのためには当てずっぽうから修正されて徐々に賢くなっていくというプロセスが絶対必要であるという。しかしそのことが分かったのはつい最近のことであった。   だから後に扱うLLM(大規模言語モデル)も、文章の一部を伏字にして当てさせるという問題を膨大な数だけこなさせることで人間と話せるような心を持った。ではこの自己学習型のAIをこれまでなぜ作り出せなかったのか?それには膨大で高速の演算が可能なAIが必要で、技術が追い付けなかったからであるという。