あなたが街を歩いていると、見慣れたあの生き物を見かけました。両耳がピンととがり、ヒゲと尻尾が生え、身軽に動き回って「ニャー」と鳴くあの生き物です。そう、猫ですね。あなたは近づいて行って触ろうとしたり、写真を撮ろうとしたり、あるいは横目に通り過ぎたりするかもしれませんが、それは猫を「猫」と認識しているからです。考える間もなく、一瞬で。では、人工知能はどうでしょう? 実はAIにとって、「猫(もしくは犬や花などあらゆるもの)を猫と認識・判断できるか」は、大きな壁でした。それを突破したのが、50年に一度のブレイクスルーと言われる「ディープラーニング」なのです。どんな技術なのか、詳しく解説します。

ディープラーニングは機械学習の一つ

2012年、世界中の研究者たちを驚愕させる出来事が起きました。世界的な画像認識コンペティション「ILSVRC」で、トロント大学が開発した「SuperVision」が、2位以下に圧倒的な差をつけて優勝したのです。「ILSVRC」とは、1000万枚の画像データを認識させたコンピュータに、犬や花、車などの画像を見せて正解率を競うコンテスト。それまで正解率74%代で推移していたのを、「SuperVision」は一気に84%代まで上げたのです。この躍進を支えたのが、ディープラーニング(深層学習)でした。

 

ディープラーニングとは、機械学習の一つの手法です。機械学習とは、人間がプログラミングしなくても、コンピュータが自ら学習して判断できるようになることです。といっても、全く自動的に学んでいくわけではありません。まず人間が、画像や音声などのデータを「入力」して用意し、その答えである「出力」とセットで読み込ませます。それを大量に繰り返すことで、コンピュータが「入力」と「出力」の間に法則を見出していくのです。その法則を「モデル」と呼びます。モデル作成のための方法は複数あり、その一つがディープラーニングです。

機械が猫を認識した歴史的瞬間

前回、脳の神経回路を再現した「ニューラルネットワーク」について触れました。ディープラーニングも、この構造をもとにした手法です。ニューラルネットワークは、基本的に「入力層」「中間層」「出力層」の3層で構成されています。この「中間層」で、コンピュータは入力と出力の間に法則を見出していきます。

 

しかしたった一層しかなくては、複雑な処理はできません。「入力層」で猫の画像を認識させ、「出力層」で猫と答えを設定しても、その間にはさまざまな壁があります。線の形状はどうか、顔のパーツの形は、顔の構成は、そもそもどの角度・距離から捉えた画像なのか、明るさはどうか……など。中間層を数十あるいは100以上の階層にすることで、ようやく猫を猫だと判断できるだけの精度になるのです。

 

ディープラーニングの考え方自体は、かなり昔からありました。しかし、100を超える階層を処理するには、これまでのコンピュータでは能力が足りませんでした。また「入力」のために大量のデータを認識させる必要があるのですが、その収集手段もありません。ところが、コンピュータの能力向上と、インターネットの出現でデータ収集が容易になり、ディープラーニングはようやく花開いたのです。

 

それを実証したのは、AI研究のトップランナーであるグーグルです。2012年、同社が開発した「グーグルブレイン」は、Youtubeで大量に猫の画像を読み込ませることで、猫の特徴を自ら学んでいったのです。これまでは人間が教えなければならなかった領域に、人工知能が自らたどり着いた瞬間でした。

人工知能がトマトを自動で収穫する?

ディープラーニングがさらに注目を集めたのは2016年のことです。グーグル参加のディープマインドが開発した人工知能「アルファ碁」と、世界トップクラスの棋士イ・セドルが対局しました。5局のうち、結果はアルファ碁の4勝1敗。圧倒的な勝利だったのです。実はアルファ碁にも、ディープラーニングが用いられています。驚くべき点は、アルファ碁には囲碁のルールが組み込まれていないことです。

 

それでも、3000万局もの対局を通じ、「この状態は有利」「この状態は不利」と学習して、トッププロを寄せ付けない強さに成長したのです。同じく同社が開発した人工知能「DQN」は、50種類のゲームをプレイさせたところ、29本でプロゲーマー以上のスコアを出しました。これもゲームのルールは一切教えられず、スコアと画面のピクセル数のみの情報から、自ら攻略法を学習していったのです。

 

ディープラーニングは、音声・画像認識、運動の熟練と進化していき、すでに実用化への応用が進められています。その一つとして、ロボットアームによるピッキングがあります。これはたくさんの物が積み重なっている山の、どこからどういう順番で取っていくのが最適か、試行錯誤を繰り返しながら学習していくのです。人工知能研究の第一人者である、東京大学大学院工学系研究科の松尾豊准教授は、ディープラーニングはこれから農業分野でも応用されるのではと予測しています。木になっているトマトをAIが画像認識し、人間よりもはるかにスピーディに収穫していく……こういった未来が現実的に訪れるということです。また、現時点では難しいとされる「自然言語処理」、つまり私たちの自然な話し言葉をも理解し、日本語入力や機械翻訳、自動要約にも対応していくとしています。

 

いかにディープラーニングがすごいか、少しでも実感していただけたでしょうか? この技術は今後、多くの産業で応用され、生産性を向上させていくでしょう。その波を乗りこなすためにも、ぜひ基本的な知識を身に付けておきたいところです。

 

参考:

よくわかる人工知能 最先端の人だけが知っているディープラーニングのひみつ (KADOKAWA / アスキー・メディアワークス) 清水 亮

グーグルに学ぶディープラーニング(日経BP社)日経ビッグデータ

人間さまお断り 人工知能時代の経済と労働の手引き(三省堂)ジェリー・カプラン

人工知能が変える仕事の未来(日本経済新聞出版社)野村直之

ライター: 肥沼 和之

大学中退後、大手広告代理店へ入社。その後、フリーライターとしての活動を経て、2014年に株式会社月に吠えるを設立。編集プロダクションとして、主にビジネス系やノンフィクションの記事制作を行っている。
著書に「究極の愛について語るときに僕たちの語ること(青月社)」
フリーライターとして稼いでいく方法、教えます。(実務教育出版)」