【本】17040『グーグルに学ぶディープラーニング』日経ビッグデータ

投稿者: | 2017-03-17

Googleのディープラーニングについて書いてある。
現在公開されているGoogleのAPIや、有用なライブラリなどが紹介されており、Pythonを使っている人にはわかりやすいかもしれない。
まあ、きちんとPythonを使っている人からしたら、常識なのかもしれないが。

TensorFlowというライブラリが紹介されていて、さらに調べてみるとKerasというライブラリもあるそうだ。
この記事もPythonからアップしているが、私はPython初心者だ。
まだGoogle翻訳APIで遊ぶくらいしかできないが、このあたりのライブラリが使えるようになってみたい。

人工知能自体がコモディティ化するという意見には賛成だ。
Googleは、このようなライブラリを惜しげもなく公開しているし、現時点でGoogleやAmazonなどに敵うベンチャーはいないだろう。
これからは、AIが共通化するのは当然として、そこに利用してもらえるデータの価値が高くなるのだろう。

企業の競争力はデータを収集し、価値に変える能力です」

イノベーションとは、お客さんに聞いても答えられないような問題を解決したときにのみ生まれる」

利用者の課題を、利用者が思いつかない形で解決する製品、サービスこそがイノベーション

大きな経済効果が期待されているのが医療、ヘルスケアの分野です。病院、健康保険組合、個人のヘルスケアアプリなどに分断されて記録されている治療、健康診断、ライフログのデータを統合すれば、病気になった人と健康な人は食習慣や睡眠などの生活、治療や薬の服薬状況がどう違うのかを分析できます。その結果を基に健康指導や治療をすることで、疾病や重症化を防ぎ、高齢化により増加が続く医療費の削減につながることが期待されています。

は、機械学習もディープラーニングも、人工知能を実現するための手法

エキスパートシステムは一時期、かなり流行しました。教えなければならないことが非常に多い代わりに、狭い分野で確率的な判断をするケースでは有効に使えるシステムです。医療診断などで、症状から特定の病気である確率を計算するというような使い方をされていました」(賀沢さん)

機械学習で扱われるモデルには、多くの種類があります。「決定木」「帰納推論」「ニューラルネットワーク」「ディープラーニング」などが代表的なものです。ここでようやく「ディープラーニング」が出てきました。機械学習の1つの手法が、ディープラーニングというわけです。

教師あり学習では、正解だったか不正解だったかという情報を「教師」として、画像とセットでコンピューターに教えます。そうして、だんだんと正解の出力が得られる確率を高めるように、内部のパラメーターを調整していくのです。それが学習の過程です。

「教師なし学習」という手法もあります。「強化学習」は、この教師なし学習の一種

ニューラルネットには2種類あり、1つが「次の指し手」を決める「ポリシーネットワーク」、もう1つが勝率を計算し勝者を予測する「バリューネットワーク」です。ポリシーネットワークでは、指し手を探索する範囲を狭めていることが特徴です。一方、バリューネットワークでは、探索の深さを狭めています。  ディープマインドでは、このニューラルネットを、囲碁の達人たちが残した3000万を超える指し手を使って、学習させました。

ここからがコンピューターのすごいところですが、アルファ碁は自分のニューラルネットの間で自動的に対局を行うことができます。佐藤さんは「アルファ碁は、架空の対局を自分で繰り返し、勝利という目的に向かって調整を続けました」と表現します。

・Google Cloud Vision API  Vision APIは、画像認識、画像分析の機能を提供するAPIです。Vision APIを利用することで、画像の内容を認識して処理するアプリケーションをユーザーは手軽に作ることができます。

・Google Natural Language API

Natural Language APIは、自然言語処理を行うAPIです。テキストの構造や意味を認識し、文章が何を言おうとしているのかの判断に役立てることができます。

ディープラーニングの手法をカスタマイズして利用したい場合には、グーグルが用意する機械学習ライブラリの「テンソルフロー」が役立ちます。  佐藤さんは「テンソルフローを利用することの最大のメリットは、パイソン(Python)という言語で簡単なコードを書くだけで、ディープラーニングを利用できることです」

は、「得意なところは、大量にデータがあるような非常に複雑な問題です。複雑な問題になればなるほど、ディープラーニングは力を発揮します。多くの情報から瞬時に行動を判断しなければならない自動運転などは、ディープラーニングを使わないと実現できないでしょう。画像認識や翻訳なども適する例です」

機械学習やディープラーニングをビジネスのどこに適用したらいいか、その発想ができることが重要です。

既存のモデルを活用して約130枚という少ない教師データで、ある程度高い精度の認識ができることを示したこと

テンソルフローで利用できる「Inception−V3」という一般的な画像認識モデルを使い、画像データから特徴量を抽出したベクトルを作成します。この際に、約130枚の自動車の空撮写真を教師データとして利用しています。特徴量を抽出したベクトルは、さらに機械学習の一種であるSVM(サポートベクトルマシン)で学習し、結果を得る仕組みです。

1.コスト削減 2.付加価値を高めて新たなビジネス機会を創出 3.クリエイティブ性の向上

実際に各社で、(1)ビジネス現場で適用可能かどうか、(2)それに関連したデータを保有しているか、(3)データがディープラーニング向きかどうかの3つの条件で検討を進めると、各企業で進められる可能性があるディープラーニングのプロジェクトは片手で数えられる程度というのが一般的だそう。であれば、「何よりやってみることが大事です」と下田さんは言います。

そして人工知能が特別でなくなった次に特別な価値を持つのは、データでしょう。ディープラーニングに可能な限り早く取り組み、知見を積み、自社に必要になるデータを理解し、1日でも早くそのデータをため始めることが大事になります。

Pocket