いまや猫も杓子もAIですが、そのきっかけはおそらくDeepLearningによる画像識別の成功でしょう。OSS的な動きも含め、どんどんと研究が実装になり世の中に影響を与えています。研究がこれほどのスピード感で実世界で利用されるようになったという点もこれまでとは全く違ったことが起きているのではないでしょうか?発表された論文に実装コードが公開されているgithubのリンクがある、なんてこともよくあるそうです。

深層学習(多層ニューラルネットワーク)といっても実はざまざまな分野や解決する問題ごとに違うネットワークが開発されていることが、本書でわかりました。基本的な構造について勉強することができます。例えば、

  • 順伝播型ネットワーク(FNN)
  • 畳込みネットワーク(CNN)
  • 再帰型ニューラルネット(RNN)

です。

そして、それら代表的なネットワークの説明の中で、どうやって学習するか、どうやって汎化性能と過学習のバランスを獲得するかというおそらく多層ニューラルネットワークでいちばん本質的な課題についてどのように解決していったのか、学習のノウハウやトリックも含めて解説があり、(完全にはわからないところもありつつも)深層学習の世界の語彙を背景と共に理解することができました。

また近年、多層ニューラルネットワークが急速に性能を上げることができた背景として、

  • 一定上の規模の学習データがあること
  • クラスタ/並列処理を含む、計算機能力の向上

が上げられています。

まさに深層学習は、近年のインターネット/クラウドコンピューティングの成果といえるんですね。これから深層学習関連では、どんどん新しい手法が開発されていくと思いますが、本書を読むことで、そういったニュースを一歩深く、理解できるようになるんじゃないかと思います。