トップページ > 記事閲覧
「アルファ碁ゼロ」の激震
【「週刊碁」2017年11月13日号 2017年11月6日発売】

日進月歩の囲碁AIの世界から、また驚くべきニュースがやってきた。ディープマインド社が「Mastering the Game of Go without Human Knowledge(人間の知識なしで碁を習得する)」という論文を発表したのだ。そこには新版アルファ碁というべき「アルファ碁ゼロ」の存在があった。「アルファ碁ゼロ」は、ルールだけ教えられた後は自己対戦のみで棋力を向上させ、従来のアルファ碁を圧倒する存在となっていた。(本紙・森本孝高)

ディープマインド社がホームページ上に10月18日付けで発表した論文「Mastering the Game of Go without Human Knowledge(人間の知識なしで碁を習得する)」の中に、独学で囲碁を覚えたという「アルファ碁ゼロ」(以下、ゼロと表記)の存在があった。ゼロについて紹介する前に、これまでのアルファ碁の推移を整理する。

アルファ碁が韓国・李世石九段に4勝1敗で勝利したのは2016年3月。このバージョンを「セドル版アルファ碁」と呼ぶことにしたい。そして2016年の年末年始にトップ棋士らを相手に60連勝したのがアルファ碁の改良版「マスター版アルファ碁」だった。そして2017年5月に中国・柯潔九段を破ったアルファ碁はマスター版がさらに洗練されたものと考えられる。

これらのアルファ碁は人間の棋譜(つまり従来の人間の知恵)を学習した後、自分自身との対局によって棋力を向上させた。しかしゼロは違っていた。ルールしか教えられず、自己対戦のみで上達した。最初は滅茶苦茶だったが、やがて生き死にを理解し定石や手筋を自力で学んでいった。そして覚えて3日目(といっても490万局打った後)には、セドル版に100勝0敗のスコアで圧勝。40日後(2900万局打った後)には、マスター版に89勝11敗のスコアになった。AIが自己学習のみで人間のレベルを超えるほどに上達したのだ。囲碁界が驚いたのはもちこん、科学の世界にとっても大きなブレークスルーだった。論文にはゼロが囲碁を覚え始めたころの棋譜やゼロ対セドル版、ゼロ対マスター版、ゼロの自己対戦の棋譜が紹介されたいる。囲碁AIに詳しい大橋拓文六段によると「ゼロは中盤が強い」。しかし「ゼロとマスターは人間から見たらすごく小さい差」とも付け加えた。ゼロはすでに人間が論評できないくらい強くなっているのは確かだ。



これはゼロがルールを覚えてからの上達曲線(桃色の実線)だが、驚異的な速度で棋力を上げたゼロもセドル版レベル(人間レベルの点数、グラフでは水色の点線)に匹敵するレーティングに差し掛かるとそのスピードは緩やかになっていた。マスター版レベル(紺色の点線)に達すると極端な上達は見られなかった。AIの上達も、悠久の時間の中で人間が囲碁を究めてきた道筋と類似しているとは言えないだろうか。人間の凄さを証明しているようにも思われる。

ここまでくると、もっと強いアルファ碁を見てみたい。しかし、論文が提出された2017年4月以降、ディープマインド社はアルファ碁の開発をしていない。それはアルファ碁の思考をどのようにして世界規模の課題(エネルギー問題や医療問題など)の解決のために応用するかが一番の関心となっているためだ。ではもうゼロには会えないのだろうか。関係者によると論文を読み込むことができれば、ゼロのクローンを作ることができるという。しかしディープマインド社はグーグルの系列会社であり、豊富な資金力を使って、最先端の機械を揃えている。一般の研究者がすぐに同じものを作るは難しい。だが技術革新は猛スピードで起きている。ゼロのような囲碁AIが我々の身近な存在になる時代は意外とすぐそこまで来ているかも知れない。

ゼロの定石成長過程に注目
発表された論文には研究内容が詳細に綴られていて、ゼロの成長速度や他の囲碁AIとの棋力比較など様々なデータが図示されている。この論文のうち定石や棋譜に関する部分に焦点を当てて紹介しよう。


この10個の図は、ゼロが自己学習の過程で示した頻出形の一部である。図は出現頻度を縦軸に、学習開始からの時間を横軸に表している。1図の黒1はまるで価値の低い手だが、白2から4の応酬が学習開始10時間ほどの時点ではそれなりに出現したが、その後20時間を境に皆無となった。人間界ではほとんど見かけなかった4図、6図は50時間から出現し始め、70時間頃には次第に増加した。今後の囲碁界への影響が予想される。5図はいわゆる定石。非常に高い出現頻度だが、時間の経過とともに頻度が減じている。7図、8図はの定石は約40時間でピークに達し、その後減少している。ゼロは独学で勉強したはずなのに、人間が打っていた定石を身につけているのは興味深い。

総譜1総譜2総譜3

この棋譜は膨大な数の棋譜の一部。3時間目の棋譜(総譜1)はまるで石を取ることを覚えたばかりの入門者同士の対局のようだが、19時間目の棋譜(総譜2)になると少しは碁らしくなっているもののまだ初段レベルだろうか。それが70時間目の棋譜(総譜3)になるとほぼプロのレベルに達している。総譜3は李世石九段と対戦したアルファ碁のレベル追いつく直前くらいであろう。

詳しいデータなどはディープマインド社のホームページから閲覧することができる。興味のある方はそちらをご覧いただきたい。
コメント終了
Page: [1]

題名
会員名
会員ID :
会員パスワード
コメント

   クッキー保存