2023年5月6日土曜日

連載エッセイ 3-4

 ディープラーニングとは?

前回始めたニューラルネットワークの話を続けよう。その始まりはローゼンブラットのパーセプトロンであったことは述べた。それはシンプルなあみだくじのような構造を持っているだけであった。入力層と隠れ層と出力層の一層ずつのサンドイッチのような形をし、各層はほんの数個の素子を含んでいるだけだった。私はそれを一種のあみだくじのような構造に例えたのだった。

しかしこれも前回で少し触れたが、それから半世紀あまりが経過する中で、それはみるみる進化して言った。それが現在ディープラーニングと呼ばれているものである。

ディープラーニングは日本語で「深層学習」と訳されているが、最近は特にこの言葉を耳にすることが多い。コンピューターの技術が発展して、いよいよ人間の脳に近い機能を備えたAIが出来つつあるが、それを支えている機能が、このディープラーニングだからだ。要するにニューラルネットワークの中で、入力層、隠れ層、出力層をどんどん複雑化していったのがこのディープラーニングだと考えていただきたい。

最新のディープラーニングは隠れ層が1層どころか1000層もあり、素子も数千を数えるようになる。そして素子の間をつなぐ重み付け(パラメーター)は、何と億の単位に至る。2020年にオープンAIがリリースしたGPT-3はパラメーターの数が1750億というのだから途方もない数である。どうやらこのパラメーターの数がディープラーニングの性能をかなり大きく左右するということも分かってきたのだ。

このディープラーニングのスピードはといえば、GPUGraphics Processing Unit)をふんだんに用いた途方もない値を示す。パソコンでソフトを動かすCPUに比べて、GPUは単純だが膨大な数の計算をこなすことが出来る。1秒当たり13.4兆回の計算ということだがもはやどのくらい速いのかピンと来ない。しかもそこには新たに誤差後方伝播という手法が加わることでその性能は飛躍的に伸びたとされる。この誤差広報伝播とは、入力層から出力層へという一方向の情報の流れではなく、反対側にフィードバックを流していくという方式だという。こうして2010年代からディープラーニングによる第三次ブームが飛躍的な形で始まったのだ。

しかしどれほど進化したとしても、ニューラルネットワークにおいて行われていることは基本的には変わりない。入力があり、隠れ層があり、そして出力が行われるというところは同じだ。そしてそれは基本的には心が行っている動きと似ていると考えることができる。ここで入力とは刺激であり、問いかけである。つまり外界から入ってくるものである。そして出力とは返事であり、運動である。またそれは感情であるかも知れない。そしてそれは人の心の働きと似ている。私達は結局は何かに刺激を受け、何かをアウトプットし続ける生き物、と捉えることが出来るのだ。しかし人間の心がこのように入力と出力から成り立っているものとして単純化できるようにも思えない。あくまでもAIAI、心は心で、両者は別物である・・・・・。

このような楽観論(悲観論ともいえるかもしれない)について考え直さなければならないことが現在起きている。いうまでもなくチャットGPTに代表されるようなAIの出現である。つまりAIは突然人のようにふるまい、囲碁とか将棋では人間のプロの棋士ではとても太刀打ちできないほどの力を発揮するようになってしまった。