人工知能(AI)って何やねん!?~人工知能を一番わかりやすく説明する

 人工知能の入門書はないか・・・最近、そんな資料を求める人が多くなった。このところ、テレビやネットで「人工知能」や「AI」のキーワードを頻繁に目にする。いまやあらゆる業界、立場の人にとって、知らないでは済まされなくなってきたのだ。

 皆が知りたいのは、「人工知能ってなんやねん」そんな素朴な疑問にズバリ回答した資料だ。

 ところが、いくら探してもこの手の入門書は見つからない。「入門」と名の付く本はあるが、専門家が書いたものが多いため、漠然とした動向か、専門用語が並んだ難しい内容の本が多いようだ。 

一応、人工知能の入門書

 

 人工知能についてWikiを調べると、次のように書かれている(ちょっとだけ変えてあります)

 

人工的にコンピュータ上などで人間と同様の知能を実現させようという試み、
或いはそのための一連の基礎技術のことやねん”

 

 人工知能は既に身近にある。iPhoneの Siri や、Windowsの Cortana だ。アマゾンで買い物をしていると「おすすめの商品」とかいって出るアレもそうだ。

 テレビやネットの報道を見ると、人工知能はもっと広い意味で使われている。少しでもそれっぽいものは、何でも都合よく「人工知能」と称してPRされているようだ。

 

 

IoTやって何すんねん

 

 IoTとはモノをネットにつなげて何かする、というもの。製造業を営む企業ではどこもIoTに力を入れている。大抵は上からの命令だ。
 実はこれ、人工知能と深い関係があるのだが、

 

センサーつけてデーター集めて・・それで何すんねん

 

 やらされている側は、何をするためにセンサーを追加するのかがよくわからない。
 多く企業でデーターを集めたあとのビジョンがない。普通はビジョンや目的が先にあって、そのためにセンサーを付けるなどのアクションをするものだ。

 「何のためにやるんですか?」上に聞いてもマシな答えは期待できない。しかし、目的もなく取ったデーターでも、沢山集まれば、後述するようにいろいろ役に立つ。いまはただ、ひたすらデーターを集めることが重要だ。

 

 

機械学習ってなんやねん

 

 通常、人工知能は、「機械学習」して作られる。

 機械学習については SAS Institute Japan の次の説明がわかりやすい

 

「データから反復的に学習し、そこに潜むパターンを見つけ出すこと」

 

 要するに、人工知能とは、データーを使って学習させた演算機(アプリ)のことだ。

 

 といっても、まだ少しってもピンとこないかもしれない。機械学習の具体的手順は、エクセルのcsvファイルか、画像データー(写真)などを用意して機械学習するソフトに読み込ませて計算するだけ。

 機械学習の中身がどうなっているのか、気になる人がいるかもしれない。それはテレビがどうして映るのか、知らなくても生活に支障がないのと同じ。理屈を知る必要はほとんどない。

 

 

人工知能で何ができんねん

 

 物体の特徴を自分で覚えて、人間の代わりに判断できるアプリを作れる。
 これを実現するためには、人間が物事を覚えるのと同じように、データーが必要だ。例を示す。

 

 クルマの自動運転をやるために、信号、標識、クルマなどを識別したい
  →信号、標識、クルマの画像データーを使って学習させる。

 食品の異物検知をしたい
  →異物の無い画像、異物の入った画像のデーターを使って学習させる。

 東方キャラの顔から名前を識別したい
  →キャラ別の画像と名前をセットにしたデーターを使って学習させる

 異性の好感度を数値化したい
  →顔写真と好感度をアンケート調査して集めたデーターセットを使って学習させる。

 ワインのパーカーポイントを機械で計算させたい
  →パーカーポイントが付いているワインを味覚センサーで測定し、そのデーターセットを使って学習させる。

 

 顔でも、言葉でも、芸術の感性でも、関西人の度合いでも、何でも、どんなことでも、データーさえあれば、覚えこませて人間の代わりに判断するアプリを作れる。

※:分類問題のアプトプットは確率。霊夢98%、咲夜1%・・だからこれは霊夢なんだといった感じになる。

 

 ただし、人工知能に教えるのはあくまで「人間」。人間が「あれは信号だよ」「あれはクルマだよ」というように教えなければならない。人間が教えたものについては、人間並みか、それ以上の精度で識別する(ミスをしないので)。
 人間が教えるので、人間が識別できるものは、基本的に学習させることが可能。しかし、今の人工知能はまだ、自分で自分を改良することができないので、人間の認識範囲を超える識別はできない。

 

参考:パーカーポイントの高いワイン

 

 

10年後に今の半分の職業が消えてなくなるってホンマ?

 

「これ印刷ですね」

 掛け軸の目利きも、本物と印刷の掛け軸(無数の画像データー)を人間が見て、違いの特徴を獲得した結果だ。

 掛け軸に限らず先の事例は、どれも今まで人間にしか出来ないとされていたこと。これが出来るとなれば、今後はどんどん、機械に代替されていくだろう。
 経験や知識を元に成り立っている商売は、今後どんどん無くなっていく。これはもう、避けられない流れだ。

 いま私には高校生の息子がいるが、将来の進路について「IT産業に行けよー、モノづくりや事務屋はだめだぞー」そうアドバイスしている。

 

 

ディープラーニングってなんやねん

 

 人間は、「これは飛行機だ」「クルマだ」というように判断できるが、それらは写真のような画像で記憶しているわけではなく、対象の「特徴」を憶えて判断しているといわれている。例えば「翼、胴体、尾翼」といったものが認められれば、「飛行機」と判断するようにだ。

 人工知能も人と同じように、沢山のデーターから共通する特徴を見つけ出して記憶する。

これによって、

 物体の特徴を自分で覚えて、人間の代わりに判断できるアプリを作れる。

 なぜそんなことが出来るのか!? ここで「ディープラーニング」が登場する。

 ディープラーニングとは、深層学習、つまり多段結合されたニューラルネットワークを学習するための学習方法だ。

※:ニューラルネットワーク:人の脳神経細胞を模擬した単純な演算機(ニューロン)を沢山繋げた回路網のことやねん

 

 ニューラルネットワークをたくさん繋いで深くすれば、データーから特徴を自分で見つけ出せる人工知能ができるかもしれない・・この可能性はかなり前から予測されていたが、うまく学習できる方法が見つからなかった[Wiki]

 その答えは結局のところ

 

 

多段のニューラルネットをいっぺんに学習させようとするからアカンねん。
 分割して個別に学習させてやな、最後に全部繋いで
学習したらエエねん
[1][2]※

 

 

 こうして人工知能の分野で今世紀最大といわれるブレークスルーが起きた。

※:畳み込み層を入れたら出来ちゃった、という話もありますが突っ込むと難しい世界に入っていくので、説明を省きます

 

 これは何か。大抵の人は「ウサギ」と識別できる。それは動物やウサギの特徴を、学習して記憶しているからだ。

 ではどんな種類のウサギか。種類の違いを学習していなければわからない。それは人工知能でも同じこと。

 ちなみにこの写真は、うちで飼っているウサギ。

 

ディープラーニングの入門書

スポンサーリンク

 

 

ゲーム用のグラボが人工知能の学習を加速させる

 

 人工知能の発達とゲームの発達は無関係ではない。

 ディープラーニングの計算には膨大な演算を必要とする。実はこの計算が、ゲームでリアルなグラフィックを作るための計算と共通していた。

 NVIDIAのグラボには「CUDAコア数」というスペックがある。これがニューラルネットの学習計算に役立つ演算能力を示している。
 NVIDIAは早くからこれに目を付けて、ゲームとは別に、自社のグラボを活用したディープラーニングのビジネスを拡大している。

 

 NVIDIAではDIGITSというフリーソフトを配布している。これをインストールすれば、クリックするだけで簡単にディープラーニングを実行できる。それはワードやエクセルを使うより、はるかに簡単な作業だ。

 

※:ディープラーニングの実行に必要なハードは普通のPCでOK。お金も、ほとんどかからない。グラボは必須ではないが、ないと計算時間が数十倍に増える。

 

<関連商品>
nvidiaの商品 グラボ(グラフィックボード。ビデオカードともいう)はディープラーニングの計算にも使われます
Jeston ラズベリーパイ感覚で人工知能を実装できるNVIDIAの組み込みボード。机のPCだけでなく、産業機器や生産ラインで人工知能を活用できます

 

 

人工知能の中身はどうなっとんねん

 

 「人工知能の中身が見たい」と思う人がいるかもしれない。人工知能の中身を覗いても、抵抗やコンデンサ、歯車などは見えない。

 多段結合されたニューラルネットの実態は、大規模な行列演算機(ソフトウェアのプログラム)だ。学習で獲得するという「特徴」の実態は、その個々の係数(ニューロンの重み係数)にすぎない。

「コレでどうして顔のメイクから男性の好感度が計算できるの?

そう考えて係数を眺めてもサッパリわからない。これは人間の脳を覗いてもわらないのと同じ。「中身が見えるブラックボックス」といえる。

 

deeplearning.net/tutorial/より転載

 ちなみに、数字などの単純な画像の特徴を学習させたものは、どんな特徴を覚えたのかイメージできる形に視覚化できる。

 左はMNIST(0~9までの手書き数字データーセット)をディープラーニングして覚え込ませた結果。画像では人工知能が具体的に数字のどんな特徴を獲得したか、視覚的に観察することが出来る。

 

※:顔のメイクから男性の好感度を数値化するAIは、メイクの写真と、それに対する好感度を調査したデーターがあれば実現可能だ。

 

 

データーがなければ何も始まらん

 

 多段結合されたニューラルネットとディープラーニングがいくら優れているといっても、学習させなければ何の役にも立たない。
 そのために必要なのが「データー」だ。しかもできるだけ多いほど良い。ここで、IoTやビッグデーターの話と繋がってくる。

IoTやって何すんねん

その目的は工知能を作るためのデーターを集めることだ。モノをネットにつなぎ、クラウドにデーターを蓄積する。これを続けていくと膨大なデーターが集まる(ビッグデーター)。

 沢山のデーターがあれば、いろんな切り口で人工知能の学習に活用できる。これによって、今までにない、新しい商品やサービスが創造できる。自動運転もその一例だ。

 これからのビジネスは「データをどれだけ持っているか」で決まる。会社の大小や、広い工場、生産設備の優劣はもう関係ない。数人のベンチャーが特定分野でgoogleに勝つことだって不可能ではない。

 データを熱心に集める企業と、集めない企業とでは、将来、どうしようもない格差が生まれると、私は予測する。

 

 

無料クラウドサービスの落とし穴

 

 ところで、人工知能で先行するGoogleはずいぶん前から熱心にデータを集めている。Googleにとって、のどから手が出るほど欲しいものがある。それは、個人で撮った写真だ。

 この種のデーターは「あなたが撮った写真、くれませんか?」と言って貰えるものではない。お金を積んでもダメなものはダメ。そこで、

 

 「写真の置き場に困っていませんか?うちで作りましたので自由に使ってください。もちろん無料です」

 

 としたのだ。こういったサービスを展開する企業はほかにもある。規約を読むと、大抵は置き場を提供した人がサービス向上を目的(人工知能の学習に)に自由に使っていいことになっている。

 

 

将来、機械に支配されるかもしれへん

 

コンピューターの進歩と今後を予見するロードマップ(インテル資料)

 ムーアの法則という言葉を聞いたことがあるだろうか。コンピューターはこれに従って進歩してきた。それが終わるのが2045年。ここでコンピューターは、自分で自分を改良する能力を身に付け、加速度的な進化を始めるという。
 この変化点のことを「シンギュラリティ」といわれている。 

 

 シンギュラリティの先に何が待っているのか、私たちにはわからない。いま、人工知能を作る関係者の間で、懸念されている問題の一つだ。私は次のような結末を想像している。

 

 人間は働かなくてよくなり、南国のビーチでトロピカルジュース片手に日光浴できる。

 環境を汚し資源を食いつぶすだけの人類は必要ない・・そう思われて抹殺される。

 ロボットがが地球を支配し、人類は愛玩用のペットとして生かされる。

心配だからシンギュラリティの手前で進歩を止めたい

 そう思う人もいるが、私たちにはどうすることもできない。おそらく、この分野で一番進んでいるgoogleがやらかしてしまうだろう。

 2045年といえば、もうすぐ。この記事を読んでるほとんどの人が生きている。みんなでその結末を見届けようではないか。

 

<関連記事>
pepper と無料クラウドサービスの落とし穴
クルマの自動運転とGoogleの野望

<参考文献>
1.ディープラーニング 情報処理学会研究報告 Vol.2013-CVIM-185 No.19
2.技術解説 ディープラーニング 映像情報メディア学会誌 Vol.68,No.6,p466-471