トップページ > 過去ログ > 記事閲覧
AI囲碁はどこがどう強いのか、大橋六段がその「思考法」を解説
【2017年7月10日 週刊ダイヤモンド編集部】


世界最強棋士の中国・柯潔九段はアルファ碁に3連敗した  写真提供:Google

人類最強棋士相手に3連勝を飾った米グーグルの囲碁AI「アルファ碁」。10年先と言われていた人類に対するAIの完全勝利は、囲碁界に激震をもたらした。人類が積み上げてきた囲碁の定石は過去のものとなり、アルファ碁の戦い方は囲碁の常識を覆そうとしている。AIの勝利は囲碁界に何をもたらしたのか。人類とAIはどう向き合っていくべきなのか。アルファ碁に揺れる囲碁界の現状を、大橋拓文六段が描く。

将棋界で藤井聡太四段がデビュー以来の29連勝という新記録を達成した。将棋界の枠を越え、社会現象と言えるフィーバーぶりである。囲碁・将棋界を合わせてみても、1996年の羽生善治七冠誕生以来のビッグウェーブと言えそうだ。中学生棋士が公式戦で土つかずの29連勝はもちろん偉業だが、ここまで棋界を飛び越えたニュースになったことは、昨今、AIの台頭で揺れる私たちプロの棋士にとって、非常に喜ばしいことである。

囲碁界にAIという黒船が到来したのは2016年のことだった。米グーグル傘下のディープマインドが開発した「アルファ碁」の登場である。昨春、世界トップクラスの韓国人棋士、李世ドル九段を破ったときは、韓国で“AI鬱”という症状が現れたとも聞いた。今年5月、さらに進化したアルファ碁が再び姿を現し、現在世界最強と目される中国人棋士の柯潔九段を3−0で下した。棋士たちはもう心の準備はできていたが、それでもアルファ碁の進化は凄まじいものがあった。李世ドル戦から柯潔戦の1年余りで、大きく変わり始めたことがある。囲碁AIは人間と勝負する存在から、「囲碁を理解するためのツール」として、棋士たちが受け入れ始めたのだ。実際、柯潔九段はアルファ碁戦以後、18連勝中(継続中、7月7日時点)であり、アルファ碁の手の研究は世界中で非常に活発に行われている。将棋の藤井聡太四段も将棋AIを活用していると聞いた。

人のレベルを超えたAIとの練習は、野球でいえば時速200qのバッティングマシーンで練習するようなものだ。自分のプレースタイルが壊れるリスクもあり“諸刃の剣”だが、成功すれば絶大な効果を得ることができる。グーグルのディープマインドはAIの試金石として囲碁というフィールドを選んだ。囲碁はとても奥深いゲームで底が見えない。しかし、必ず勝ち負けがつく。このボードゲームでAIの進化の様子を追い、AIと向き合うヒントになれば、筆者としてこれ以上の喜びはない。

「直感」を手に入れたアルファ碁

囲碁は19×19=361の碁盤で争われ、その変化の数は、宇宙に存在する全ての原子の数より多いとされる。コンピュータの計算力をもってしても膨大で、囲碁が難攻不落と言われていた理由だ。ただ、「コンピュータは全部しらみつぶしに読むから強いですよね」という質問をよく受けるが、アルファ碁は全ての変化を読んでいるわけではない。例えば米IBMが開発したチェスAIのディープブルーは1秒間に2億手を読むが、アルファ碁は1秒間に1万手しか読まない。それではなぜ、アルファ碁は強いのか。アルファ碁がそれまでの囲碁AIから急速に強くなったのは、ディープラーニングを取り入れたことが大きな理由だ。そしてディープラーニングによって囲碁AIが手に入れたものは人間で言う「直感、感覚」なのだ。

直感や感覚を説明するために、まず「実利」や「厚み」という囲碁の概念を紹介したいと思う。囲碁の対局の進行中に下図のような形が現れたとしよう。


白の石に囲まれた□が白の陣地になる。□は10個あるので白地は10目だ。白の外側にある黒の石の壁は現時点で陣地を確保できていないが、うまく活用すれば将来、白より大きな陣地を作れる可能性がある

この図の■印は、白の陣地として確定された状態である。■印は10個あるので、「10目の白地ができた。白の実利は大きい」などと表現される。対して黒の外壁は、現時点では陣地を確保できていない。しかし、この黒壁を右辺、下辺や中央でこれから起こる戦いに活用することで、隅の白地より大きな黒地を作れる可能性がある。これを「厚み」と呼ぶ。この黒の壁が今後活用できそうならば、「これは良い厚みだね」と評価されるし、逆にうまく活用できなければ「厚みが働かない展開になってしまった」というように評される。つまり、厚みとは投資であり、正しく評価し、運用するためには将来への洞察力が必要となる。この厚みがどれくらい効果的なのかを判断するのが、囲碁の醍醐味なのである。大人への囲碁の入門講座では「実利は現金」で、「厚みは将来への投資」と説明すると、納得されることが多い。古くは徳川家康も愛好し、近年では経営者の方々に愛好家が多いのも、このあたりのリスクマネジメントに通じるところがあるからだろうか。

われわれ棋士は、常にこの実利と厚みのバランスに注意を払って対局している。そして、この厚みの将来性を、人間は多くの経験から来る直感で判断しているのだ。棋士にとって真に悩ましいのは次の一手を読むことよりも、上図のような局面を、黒と白のどちらが有利なのかを判断することなのである。2016年の登場したアルファ碁は、多くの経験を積むことで、人間のような直感・感覚を手に入れ精度を向上させ、トップ棋士に勝利した。この時のアルファ碁の打つ手は、人間にとって納得できる手が多かった。ところが、2017年春、進化したアルファ碁同士の自己対戦が50局公開され、囲碁界は騒然となっている。アルファ碁は、最初は人間の棋譜で学習するが、その後は自己対戦を数千万局積み重ねて、その経験を感覚的に学習する。定石を丸暗記してしまうと応用が効かないが、情報を少しずつ伝えるニューラルネットワークはこれができるのだ。

100年の常識を覆したアルファ碁


アルファ碁は黒1のような、盤端から数えて3・3の地点に打つ「三々入り」を多用する

アルファ碁の手を通じて、AIがたどり着いた“思考法”を探ってみよう。アルファ碁の自己対戦では、上図の黒1で示したような「三々入り」(盤端から数えて3・3の地点)と呼ばれる手が多用されている。この三々入りは人間の常識では中盤戦で打つ手であり、このように序盤早々打つのは「悪手」とされ、絶対に打つことはなかった一手である。

なぜか。ここから、8手進めた局面で説明しよう。人間の定石では、三々入りの後はこのような進行になり、▲印はほぼ黒地となる。黒が得た実利は10目弱だ。それに引き換え、白は厚みを得た。この厚みは10目以上の価値があるため「白有利」というのが、人間が100年以上積み重ねた囲碁の常識だった。


黒1で「三々入り」した後の一般的な定石の進行。黒は△印の10目弱の陣地を得ることができ、白は白2〜白8の壁の厚みができる

しかしアルファ碁は、平然と黒1と三々に打ち、白に厚みを作らせてしまう。人間の考えでは、黒が得た実利は10目弱で限定的なのに対し、白の厚みは、働きが悪ければゼロに近いが、良い場合は50目以上にもなってしまうリスクがある。序盤であればあるほど、厚み(=将来への投資)の働きを正確に測るのは難しい。そのため、リスクを避けて序盤早々の三々入りを人間は打たなかった。しかし、アルファ碁は、多くの対局でこの三々入りを打つ。白の厚みが、黒の得た10目弱以上には働かないと判断しているのだろうか。

将来性とリスク判断が正確なのか

アルファ碁は、厚みのもつ将来性とリスク判断が、より深く正確にできるようになったと考えられる。膨大な自己対戦から得たAIの経験値が、人間をすでに大きく超えているのだ。


大橋拓文(おおはし・ひろふみ)/1984年、東京都出身。菊池康郎氏(緑星囲碁学園)に師事。2002年入段。第1回おかげ杯準優勝。2013年六段。コンピュータ囲碁を活用した研究を日本棋院月刊誌碁ワールド「IGOサイエンス」として連載中。人工知能学会誌、情報処理学会誌に寄稿。経団連・21世紀政策研究所等にて対談・講演。在ドイツ日本大使館杯やヨーロピアン囲碁コングレス等海外普及にも取組む。著書に「AI時代の新布石法」(マイナビ)、他多数。

2017年に登場した最新版のアルファ碁の特徴は、この三々入りに代表されるように、人間にとってとても危険で、理解しにくい手が多く見られるのである。現在、この三々入りはプロ棋士も試行錯誤しながら実験的に試し、流行している。成功率はフィフティ・フィフティといったところである。棋士として毎日アルファ碁の棋譜を検討していると、アルファ碁の強さに驚くとともに、AIを信じすぎることの怖さを身をもって実感している。アルファ碁は人間より強くなったことは間違いないが、アルファ碁の手を人間が使っても、うまくいかないことが多いからだ。私たちがアルファ碁に追いついていないからなのか、アルファ碁の自己対戦で生み出された手は本当にいい手なのか、誰も知る由はないのである。また、アルファ碁が1年前に好きだった手を、現在のアルファ碁は全く打たなくなった、ということもある。

現在、アルファ碁以外にも、ディープラーニングを活用した囲碁AIの開発が活発に行われている。特に力を入れているのが、日本の「DeepZenGo」と、中国の大企業テンセントが作る「絶芸」だ。そしてこれらは、打つ手が少しずつ違う。人間のように囲碁AIには個性があるのだ。これは元々の学習データの違いや、進化過程での自己対戦に左右されるようである。このように、すでに囲碁ではAIの示す手が、人間の考えと違う手を示すようになってきた。他の囲碁AIはまだアルファ碁には及ばないものの、人間世界トップと同等の実力があり、それらを比較することでアルファ碁の手を検証していくという試みも始まっている。そして遠からず、社会的な問題でもこのようなことが起こるだろう。筆者は社会より一歩早く、AIの最前線に置かれている囲碁界でAIの進化の様子を観察し、人間とAIが向き合い活用する道を模索したいと思っている。


Page: [1]