go to content

プロ棋士ざんねん! Googleに完敗

コンピューターが人間を超える日も近い?

囲碁でGoogleの人工知能がプロ棋士に初めて勝ったニュースに、囲碁ファンや研究者らが沸いている。

1月27日付の英科学誌ネイチャー電子版によると、局面の価値判断を自ら習ぶディープラーニングと打ち手を演算するシミュレーションを組み合わせた。コンピューターが局面を「評価」できる点が人工知能の発達を印象付けた。


Googleの人工知能AlphaGoは、3度欧州チャンピオンに輝いた棋士と対戦して、5戦全勝した。すでにチェスや将棋ではコンピューターが勝っているが、囲碁は複雑なため、勝つまであと10年はかかるとされていた。

対戦の様子はこちら

YouTubeでこの動画を見る

DeepMind / Via youtube.com

Googleのオフィシャルブログによると、AlphaGoは、どう勝つかを自ら考え出す「機械学習」の手法を取っているのが画期的だ。

従来は、全ての打ち手の可能性をたどる攻略法が取られてきた。一つひとつの対戦結果を最初から最後まで分析して、だんだんと勝率を上げる。

一方、Googleは人工知能を将来的に、世界で起きている現実の問題解決に役立てるという。例えば、気候のモデル化や病気の分析がある。

コンピューター囲碁の研究が専門の伊藤毅志・電気通信大学助教に話を聞いた。

「ただの白黒パターンでしかない碁石の配置から意味を理解し、評価する方法を確立した点がすごい」とBuzzFeed Newsに語った。「人間にしかできのではないかと思われてきた知的作業を代行する機械の可能性を広げた成果として注目される」という。

例えば、美術評論家の感性的な判断を学習し、絵画の良し悪しを判断したり、医者の代わりに、レントゲン写真を評価して病気を見つけたりすることも同じ手法で可能になるだろうという。

AlphaGoは、二つの手法を組み合わせている。最先端の計算手法「モンテカルロ木検索」と、人間の神経網にも似た「ディープニューラルネットワーク」だ。前者が打ち手を分析し、後者が局面の判断をする。

数百万のニューロンのような「つながり」を持つ12のネットワーク層が情報を処理する。「policy network」が打ち手を選び、「value network」が勝者を予測する。

まず、プロ棋士の棋譜から3千万の打ち手を学習させ、先の手を57%予測できるまでに実力を高めた。ただ、目標は棋士の猿まねではなく、勝つことだ。

そのため、自ら新たな戦術を見つけられるような学習をさせた。ニューラルネットワークの間で数千回対戦させ、ニューロンの「つながり」を改善。「強化学習」として知られる試行錯誤の繰り返しだ。こうして、「考える」プログラムが誕生した。

こうした大量の計算には、Googleのクラウドプラットフォームが使われた。

伊藤助教によると、局面の理解が最大のポイント。プロ棋士の棋譜から、自己対戦の繰り返すことで、新しい局面の意味を抽出し、評価基準を自ら作り上げていく。局面ごとに、何が大事なのかを「考える」のだ。

人間と戦う前に、著名な複数の囲碁プログラムと対局させた。500回の対戦で、499勝1敗という華々しい戦歴をあげた。

そこで、昨年10月にロンドンで、2013〜15年の欧州王者で中国出身のFan Hui二段(フランス)と対局。5戦全てに勝利した。コンピューターが初めてプロ棋士に勝った瞬間だった。

これまで人工知能は1997年にチェスの世界チャンピオン、2013年に将棋のプロ棋士に勝っている。ただ、囲碁は碁盤が大きく、宇宙の原子の数以上に局面があるため、世界のゲームでも最難関とされていた。

ただ、AlphaGoが勝ったのは欧州チャンピオンとはいえ、二段。3月に韓国ソウルで、世界最強とされるLee Se-dol九段と対局し、真価が問われる。



コンピュータ将棋のプログラマや研究者の声はこちら

Googleの囲碁の人工知能(AI)AlphaGoについて。 モンテカルロ木探索とディープニューラルネットワークを組み合わせたシステムが刺さったということですね。 圧倒的過ぎるマシンパワーで。。。 3月の世界界的なトップ棋士、イ・セドル九段との対局で真価がわかりそう。

論文を軽く読んでみた。DeepLearningだけでなく強化学習をしているところ、さらに手を予想するだけでなく、勝率を予想するNNを作ったというところがポイントかな・・


子どもの頃、NHKの囲碁番組を見ていて、武宮正樹さんの「宇宙流」に心惹かれた。羽生善治さんの自由な境地は、皆が称賛するところである。人間が人工知能に対抗する方法は、人格を磨くことにしかない。今回のグーグルの囲碁ソフトに「勝つ」方法は、そこにある。


バズフィード・ジャパン アダプテーション・リポーター

Saki Mizorokiに連絡する メールアドレス:saki.mizoroki@buzzfeed.com.

Got a confidential tip? Submit it here.