囲碁AI「AlphaGo」は何がすごいの? 深層学習×強化学習が人工知能に与えたインパクト

 マーケター向けに人工知能(AI)の活用について解説する本連載。第5回はGoogleの囲碁AIとして大きく話題になったAlphaGo(アルファ碁)およびAlphaGoで用いられている深層強化学習について取り上げ、マーケティング分野への応用について考える。

■AIがカンヌライオンズでグランプリ? 技術革新がもたらす進化とは

 Google傘下のDeepmind社が開発した囲碁のAI、「AlphaGo」(アルファ碁)をご存じの方も多いだろう。2016年3月に「囲碁界の魔王」あるいは「歴代最強の棋士」とも評されるイ・セドル九段と五番勝負を戦い、AlphaGoが4勝1敗で圧勝したことは大きなニュースとして取り上げられた。
画像は対戦動画より

 そのAlphaGoが、世界最大級の広告賞であるカンヌライオンズ2016のイノベーション部門でグランプリを受賞した。なぜ「囲碁のAI」が「広告の賞」でグランプリを獲得したのか?

 イノベーション部門の審査員を務めた博報堂の三神正樹氏は、「彼らの『Intuition(直感)への挑戦』という大きな飛躍への挑戦を評価し、共感した」、「まさにこれからのコミュニケーションのあり方を大きく変革する可能性を示した」と評している(参照)。

 Googleが囲碁AIを開発、というと遊んでいるように思えるかもしれないが、その評価は表層的すぎる。囲碁とは定められたルールと選択肢の中で、現在の状況(盤面)や対戦相手の打ち手を認識・評価しながら、戦略をアップデートして自分の打ち手を決定していくという、ある種のインタラクティブなコミュニケーションだ。

 さて、インタラクティブといってもパターンが少なければ対応は容易だ。では、囲碁ではどのくらいのパターンへの対応が求められるのか。

 囲碁は打ち手のパターンが10の360乗通り、あるいは400乗通り存在するといわれている。宇宙に存在する原子の数が10の79乗〜81乗と推定されているので、この数字の大きさがどれほどのものか想像もつかないと思う。ちなみにGoogleの社名の由来はGoogol=10の100乗の誤植、という噂があり、「世界中の情報を整理し、世界中の人々がアクセスできて使えるようにする」というGoogleのビジョンと合っていると思うが、その10の100乗をも超える数字だ。

 これほど大きい数字になると、コンピュータで全パターンを記憶しておいて、ルールベースで(=静的に)打ち手を決める、というやり方では難しい。そのため、囲碁AIを成立させるには上述したような認識・評価・打ち手の決定といったプロセスをアドホックに(=動的に)判断してゲームを進めていくアプローチとならざるを得ない。このアプローチでAIがプロ棋士に匹敵する強さになるにはあと10年かかるといわれていたが、AlphaGoはそれを10年前倒しで達成した。

 このAlphaGoの考え方や設計は、先に述べたような「インタラクティブなコミュニケーション」をAI化する方法論として応用可能なのではないかという大きな期待がもたれている。これが、囲碁AIであるAlphaGoがカンヌライオンズでイノベーション部門グランプリを受賞した評価ポイントだったのではないかと考えられる。

 では、「インタラクティブなコミュニケーション」の方法論として期待されるAlphaGoの中身(構築プロセス)はどのようになっているのか。次のページで整理して紹介していこう。

続きはMarkeZineで

関連記事(外部サイト)