文系でもAI開発できる? ソニーが「Neural Network Console」を無償公開

文系でもAI開発できる? ソニーが「Neural Network Console」を無償公開

画像提供:マイナビニュース

●マウス操作でディープラーニングプログラミング
ソニーとソニーネットワークコミュニケーションズは8月17日、AIを実現するためのディープラーニングのプログラムを生成できる統合開発環境「Neural Network Console」を無償公開した。

統合開発環境は、直感的に操作できるGUIベースでニューラルネットワークの設計・学習・評価が可能になる。ソニーは6月に、ディープラーニング開発のためのコアライブラリ「Neural Network Libraries」をオープンソース化(OSS)している。

○ソニー社内で2015年から利用しているConsole

Librariesは、同社が2000年以前から行っていた「機械学習」の研究開発に端を発し、2010年以降のディープラーニングの研究開発で構築した第3世代コアライブラリとなる。一方のConsoleは、ライブラリが直接コードを書く必要があるのに対し、一般的なアプリケーションと同様にマウス操作とパラメーターの調整のみでディープラーニングの生成が可能になる。

同じようにGUIベースでディープラーニングを用いたプログラムを生成できるNVIDIAの「NVIDIA DIGITS」やカリフォルニア大学の「Caffe」なども存在するが、ソニー R&Dプラットフォーム システム研究開発本部 AIコア技術開発部 マシンラーニングリサーチエンジニア 成平 拓也氏によると「それらは元々設計されているニューラルネットワークモデルに対してプログラミングする必要があるのに対し、そもそもニューラルネットワークの設計自体を簡単にGUIベースで設計できるメリットがある」という。

そのため、直接コードを書くことのないプロダクトマネージャーのようなエンジニアであっても、自らの手でディープラーニングを試すことが出来る。成平氏によれば、2015年より社内で利用しているConsoleの実績として、プロダクトマネージャーであっても1〜2カ月である程度のプログラムを作れるようになったという。中には文系社員もいたとのことで、「GUIベースでプログラムを作れる大きなメリット」(成平氏)としていた。

○首振り、文字、不動産価格を識別

ソニー社内における利用方法としては「Xperia Earにおける首振り動作の検知」や「電子ペーパー端末『DPT-RP1』の"マーク"認識」「ソニー不動産の『不動産価格推定エンジン』」への応用がある。

●Xperia、電子ペーパー、ソニーの活用方法とは?

Xperia Earはイヤホンが"アシスタント"となってスマートフォンを出さずにLINEの読み上げなどを行ってくれるスマートイヤホンだ。Bluetoothでスマホと接続しているため、発話ベースで操作を行うと周囲の人間に影響が及ぶ。そこでソニーはEarに加速度センサーを搭載し、首の縦振り、横振りを検知して「はい」「いいえ」の判断を行うようにした。例えば「LINEで◯◯さんからメッセージが来ました。読み上げますか?」といったガイダンスに対して首を振るイメージだ。

ソニーは加速度センサーによる数値の変化に対して、ライブラリを活用している。人によって異なる微細な首の振り方の違いは、単なる縦軸、横軸の変化だけでは判別できないため、ディープラーニングを応用した形だ。残念ながら、「学習済みモデル」をスマートフォンアプリに組み込んでいるため、IoTで期待されている「エッジデバイスでディープラーニングの実行」といったことは実現できていない。

一方の電子ペーパー端末における応用では、「*(アスタリスク)」や「☆」といったマークを書き込むことで、該当ページを素早く呼び出せる。こちらも学習済みモデルを利用しているが、デバイスがやや特殊だ。IoT向けの省電力CPUを利用しており、通信機能を切れば最長3週間、通信機能オンでも最長1週間という長寿命が売りになる。

そのため、ディープラーニングのプログラムも負荷をあまりかけずに、なおかつ精度高くマークを認識する必要がある。そこで大きな意味を持つのがConsoleが持つ「構造自動探索」の機能だ。計算試行回数と精度のチューニングを自動的に行うことで、作業者が細かいパラメーターの変更をせずとも、ソフトウェアがバランスの取れた「認識器」の構成を導き出してくれる。

最後の「不動産価格推定エンジン」は、最寄り駅や徒歩時間、築年数、広さ、方角などの諸条件から、物件の推定不動産鑑定価格を導き出す。担当者によれば、これもConsoleの構造自動探索機能を活用してチューニングしたとのこと。前述の成平氏は、「ある程度構造を決めた上で最後のチューニングに構造自動探索を使うことが今はベストだと思う」と語っていたが、担当者は「現状の構造自動探索であっても、ある程度の認識器を配置しておけば、高い精度のチューニングを行ってくれる認識です」と話していた。

●ライブラリを公開した理由は

ディープラーニングは、人間の脳を模して「ニューロン」を重ねることで認識精度を高めてきた。特に2010年代の「畳み込みニューラルネットワーク」をベースとした技術革新は、年率50%の改善という驚異的な認識性能を記録し、人間の認識誤差を超えて正確なものとなってきた。

「さまざまな作業がコンピューターによって自動化される。一説にはGDPの10〜20%に匹敵する市場規模を持つことになり、その応用範囲は自動車や農業、製造業、小売業など幅広い。私たちは2000年以前の機械学習の知見を始め、開発者向けソフトウェアを充実させてきた。AI市場とIoTの組み合わせは、それぞれの産業ごとに語られがちだが、その裏には『認識エンジン』や『データセット』『クラウド』『プロセッサ』など共通した基盤技術がある。その開発用ソフトウェアを提供することで、産業の発展に貢献したい」(ソニー R&Dプラットフォーム システム研究開発本部 AIコア技術開発部 シニアマシンラーニングリサーチャー 小林 由幸氏)

ただし、この分野では、Googleが2015年にOSS化した「TensorFlow」や、カリフォルニア大学のCaffe、AmazonのDSSTNE、国内でもPreferred NetworksのChainerといったディープラーニング ライブラリが登場している。これらにどう対抗していくのか問われると、小林氏は「Consoleでさまざまな産業に貢献していきたいとうのが最大の趣旨」と答えた。

ソニーグループだけではせっかくのライブラリも応用範囲が限られる。一方で「IoT」はあまたの産業で活用できる可能性があるため、研究者や開発者にどんどん触ってもらい、応用・活用事例を広めていきたいというわけだ。Consoleはディープラーニングのプログラム開発の敷居を引き下げることで、誰もがディープラーニングに触れられる環境を構築するという役割を担っている。

もちろん、「ディープラーニングの技術がありながらも、グループとしてあまりアピールしてこなかった。IoTに不可欠なディープラーニングの技術を公開することで、周り巡って人材獲得などに繋げたい」(ソニーネットワークコミュニケーションズ IoT事業部門 原山 真樹氏)という狙いもあるという。

6月のライブラリ公開から少なくとも1500名程度の研究者・開発者が触れたとソニーは語る。ただしソフトウェアの改善要望などはフォームのみ、海外への周知は「学会などで発表したいという思いはある」(原山氏)などにとどまる。もちろん「コミュニティ作りは完全に巻き込めていないと思っている。今回の事例などを含めて、セミナー開催など、情報を公開していきたい」(成平氏)と課題意識はある。

OSSはコミュニティの「互助会」的な役割が大きな力を持つだけに、早急な体制作りが求められそうだ。
(徳原大)

関連記事(外部サイト)