<認知・運動系の重要性>

松尾:画像認識の場合は、カメラの中に入っているイメージセンサー自体のハードウェアは昔からいいものなので、そのままでよかった。だけど、認識のところがなかったんです。人間でいうと、ハードウェア、イメージセンサーは網膜です。人間は網膜だけで見ているわけではなくて、その信号を脳の後ろの方にある視覚野で処理しています。視覚野が先程のディープラーニングの処理に当たる。そこの処理ができるようになってきた。考えてみれば、視覚の処理って生存上、とても重要なんです。だから、脳からしてもかなりの計算量を使うんです。どっちかというと、記号・言語というのは生存上、どっちでもいいんですよ。

20180713_nikkei_16.jpg

安田:この前も大阪で大きな地震がありましたが、記号・言語だと、LINEなどの記号とテキストだと軽いのでネットワークの処理に問題はないけれど、画像をやり取りするとなると重くなってくるので、負担にはなりますよね。

奥平:データ量が圧倒的に違うんですね。

松尾:動物がやっていること、人間だと赤ちゃん、子供がやっていることの方が計算量的には大変だったということです。

瀧口:なるほど、人間の本質に戻っていくということですね。そのディープラーニングができるようになったことは、どれぐらいのインパクトですか?

<ディープラーニングがもたらす産業革命>

松尾:これは、技術的にはすごくシンプルなんです。最初、二乗法を深い関数を使ってやりますので、そのパラメーターをデータから推定しますということですから。なので、非常にシンプルなんですが、シンプルであるがゆえに、いろんな技術がどんどん積み重なっていく。これは、例えて言うならば、トランジスタ。トランジスタが素子で信号を増幅する。原理は簡単なんです。しかし、これが集積してICになり、LSI、VLSIになり、それによってパソコンができ、スマホができ、今、我々の周りはありとあらゆるものの電子機器にこの回路が入っていますが、これと同じような変化が僕は起こるんだろうと思っています。ですから、時代感で言うと、僕はディープラーニングの技術というのはインターネットの出現、トランジスタの発明、エンジンの発明、電気の発明に匹敵するぐらい、数十年に一度の大きな変化なんじゃないかなと思います。

奥平:まさに、産業革命的なインパクトがあると?

松尾:だと思います。

20180713_nikkei_17.jpg

瀧口:では、こちらの図で実際に解説していただけますか?

松尾:先程の、認知・運動系、それから記号・言語系という発展を思い浮かべていただくとわかりやすいと思います。まずは、認知の方から始まっていきます。最初は、医療画像の診断ができる、防犯・監視ができる。それがだんだん、運動系にまで及んでくる。そうすると自動運転だったり、農業の自動化、物流などいろんなロボットが出てくる。それから家事・介護など複雑なこともできるようになってくるのが、行動とプランニング、行動に基づく抽象化の段階です。次に、記号・言語系にいきます。言葉の理解ができるようになって、本当の意味でも翻訳ができたり、ホワイトカラー支援が全般的にできるようになってくるだろうと、こういう変化が起こってくると思います。

奥平:例えば、翻訳というのは2025年ぐらいには相当使えるものが出てくると?

松尾:はい。これは、僕が4年ぐらい前に書いたものですが、この予想よりも3〜5倍速いスピードで技術が進んでいます。

瀧口:もっと早くなるのではないかということですね?

松尾:そうです。それで、ここで言っている翻訳というのは、先ほどのフリップの1階部分と2階部分が統合されたような翻訳。本当の意味の翻訳ですが、今のGoogle翻訳でもそうとう深くなっていて、2階単独でもディープラーニングを使うとそうとう精度が上がるということもわかっています。

20180713_nikkei_18.jpg

安田:実際に、アメリカの雇用の47パーセントが機械化すると、深層学習の専門家で、オックスフォードのマイケル・オズボーンさんという方がセンセーショナルなことを書かれていました。

奥平:まさに、この図の一番左に「ホワイトカラー支援」とありますが、そういうことにも繋がっていきそうですね。この辺りは次回になりますかね。

瀧口:そうですね。では、次回、第3回目でこの続きを伺っていきたいと思います。松尾先生、安田先生、どうもありがとうございました。

(C)Paravi