AIが囲碁や将棋の必勝法に及ぼす影響は?

AIが囲碁や将棋の必勝法に及ぼす影響は?

【2017年7月19日　ITmedia】

コンピュータ囲碁プログラム「AlphaGo」が中国や韓国のプロ棋士を打ち負かしたのは記憶に新しい。今後ますます人工知能（AI）が発展するにつれて、囲碁や将棋の必勝法にどのような影響を与えるのだろうか……？

5月23日～27日に、グーグル傘下のディープマインド（Google DeepMind）によって開発されたコンピュータ囲碁プログラムの「AlphaGo（アルファ碁）」が、中国の世界最強とされるプロ棋士である柯潔（かけつ）氏との3番勝負で3戦全勝した。2016年3月9日～15日には、韓国の世界トップクラスのプロ棋士の1人であるイ・セドル氏との5番勝負で4勝1敗で勝ち越しており、これにより、AlphaGoは人間を超える実力を備えたことを証明した。こうした時期がいつかやってくるということは想定されていたとはいえ、あまりにも早期に実現されたことから、若干寂しい思いもする結果であった。もちろん、AI（人工知能）の研究における画期的な進展を示すものとして、歓迎されるべきものであることは言うまでもない。

さて、個人的には、コンピュータプログラムなどの進展によって、各種のボードゲーム（囲碁、将棋など）の先手や後手の必勝法の解明が進展して、これまで人間同士の対局の経験等によって得られてきた以上の情報がどの程度得られてくることになるのかについて、大きな関心を有している。将棋や囲碁の必勝法はAIの登場によって変わるのか？

先手・後手有利の状況
各種のボードゲームについて、先手や後手の有利性を巡る現在の状況は、以下のようになっている。囲碁については、陣地取りのゲームで、明確に先手が有利と考えられており、先手の有利性を「コミ」という仕組みで調整している。コミは時代によって経験などに基づいた改正が行われてきており、以前は4目半であったものが、1974年に5目半に、さらに02年に6目半に改正されている。将棋についても、一般的に先手が有利と考えられているが、その理由については、碁ほどに万人が納得するような説明はなされていないように思われる。ただし、日本将棋連盟が公表していたプロ棋士の対局データに基づけば、先手の勝率が52％～54％程度となっていた。なお、将棋の場合には、囲碁のような調整の仕組みはない。チェスについては、先手がかなり有利とされており、過去の人間やコンピュータ同士の対戦データに基づくと、先手の勝率が55％程度になっているようである。ただし、この勝率は引き分けを0.5勝とした場合の数値であり、引き分けが3割～4割程度を占めていることから、勝敗が付く場合の先手の勝率はさらに高くなっている。従って、実力者同士の対局では、後手はまずは引き分けを狙うとも言われている。なお、これらのゲームにおいては、先手と後手をランダムに決定するために、囲碁ではニギリ、将棋では振り駒などの方式が採用されている。

二人零和有限確定完全情報ゲーム
実は、このようなゲームは、ゲーム理論において「二人零和有限確定完全情報ゲーム」として分類されている。偶然（運）に左右されないゲームがこれに相当している。その具体的な定義については、その漢字表現から感覚的に理解してもらうことにして、ここでは詳しくは説明しない。これらのゲームは、理論上は完全な先読みが可能で、双方のプレーヤーが最善の手を打てば、必ず（1）先手必勝、（2）後手必勝、（3）引き分け、のいずれかになることが知られている。ただし、選択肢が多くなると完全な先読みを行うことは困難になるので、人間の行うゲームとして成立する形になっている。コンピュータの場合、人間と比べれば、より多くのパターンの解析を行うことができるため、一定のゲームにおいては、完全な解析を通じて、ゲームの結果の解明が行われている。

例えば、オセロについては、6×6の盤のケースでは、双方が最善の手を打った場合、「16対20で後手が必勝」となることが93年に証明されている。さらに、小さいころに、誰しもが遊んだ経験があると思われる五目並べについては、「先手必勝」であることが、既に100年以上も前に証明されている。また、将棋の簡略版として08 年に考案されたどうぶつ将棋については、09年に「78手で後手必勝」となることが確認されている。チェッカーについては、07年にアルバータ大学の研究グループによって、双方が最善の手を打った場合、必ず引き分けになることが証明されている。

このように、一部のゲームは解析が完了しているが、囲碁や将棋やチェスについては、いまだいかなる結論になるのかは分かっていない。即ち、仮にこれらのゲームが（何の調整の仕組みもない状態で）先手必勝だとしても、どの程度先手が有利なのかは解明されていない。

コンピュータによる囲碁・将棋の必勝法の完全解明の可能性
その意味で、コンピュータプログラムなどの進展によって、これらのゲームの必勝法の完全解明がなされることがあるのだとすれば、大変興味深いことである。ただし、これだけコンピュータの性能が向上している現在においても、囲碁や将棋について、その全てのパターンを解析して、結論を導き出すことについては相当な負荷がかかり、新たなIT技術の適用が可能になってくれば、実現してくる可能性もあるのかもしれないが、現段階での実現はかなり困難なことと考えられている。

実際に、計算機科学者の松原仁公立はこだて未来大学教授によれば、勝負が付くパターンの数について、結論が出ているチェッカーや「6×6のオセロ」の場合には、10の30乗のレベルであるのに対して、（8×8 の）オセロは10の60乗、チェスは10の120 乗、将棋は10の220 乗、囲碁は10の360乗のレベルになるとのことである。ちなみに、太陽の寿命は100億年程度と言われているが、これは約3.2×10の17乗秒ということになるので、先の数値がいかに大きな数であるかが分かる。

コンピュータによる囲碁・将棋の必勝法の解明の進展
そこで、まずは、高い能力を有するコンピュータプログラムの対局を通じて、囲碁や将棋の先手の有利性の程度等を少しでも解明していくことができるのであれば、それが当面の現実性のある目標ということになるものと思われる。例えば、AlphaGo同士の対局を通じて、現在のトップレベルの対局ではどの程度の「コミ」が適正なのか、今後囲碁の技術が進歩していくと先手の有利性の程度はどのように変化していくことになるのか、というようなことが解明されていけば、大変面白いのではないかと考えられる。
AlphaGoのサイト
ただし、グーグルは、AlphaGoで培った技術を医療やエネルギー分野に応用することに注力するということで、今回の勝利の後に人間との対局については終了することを表明している。AlphaGoは、「深層学習（Deep Learning）」という人間の脳をまねた多層構造のニューラルネットワークを用いた機械学習と、「強化学習（Reinforcement Learning）」という自己対局の繰り返しによって、自らで勝ち方を生み出すシステムを作り上げているようである。これによれば、今後こうしたコンピュータプログラム自身が、これまでにない新たな戦法を開発していくことも期待されていくことになる。これまでに人間が考え出した戦法に基づいて得られている結果が、コンピュータによる対局で異なる結果となっていくことも考えられることになる。なお、ディープマインド社は、柯潔氏との対戦終了後、AlphaGo同士の棋譜50局を公開したが、これによれば、これまでの常識では考えられない手が続出していたとのことである。今後とも、AlphaGoなどのコンピュータプログラム同士による対局は引き続き一定程度行われていくことになるものと思われる。それでも、人間を超える実力を備えるという目標を達成した後では、先に述べたような興味関心への分析に対しては、これまでのような資源配分は行われないものと思われる。本来的な AI の応用に注力していくことになるのはやむを得ないものと思われるが、若干残念な気もしている。

実は、必勝法の存在や先手や後手がどの程度有利なのかという点については、本当はあまり気にすることではないのかもしれない。現在のルールは、過去からの人間の対局を通じて得られた経験データなどに基づいて、一定の判断が行われて、設定されてきたものである。仮に、これから人間以上の先読みが可能なコンピュータプログラムが、その自己対局などに基づいて、何らかの結果を導いたとしても、人間同士の対局でそのような結果が得られるとは限らない。従って、コンピュータプログラムによって得られる結果はあくまでも参考程度のものでしかないとも言える。一方で、コンピュータプログラムが強くなっていくことを通じて、人間もまたその技術を学ぶことで強くなるというような形で、人間の能力も向上していくことが考えられる。実際にそのような形で、お互いが切磋琢磨（せっさたくま）して、さらなる高次元の勝負が行われるようになり、ゲームの醍醐味が増していくことが期待されているものと思われる。また、コンピュータによって、ゲームの結果が完全に解明されたとしても、ゲームの面白みが失われて、ゲームの寿命が終わるということにはならないだろう。五目並べもそれ自体引き続き幅広く楽しまれているし、ルールを変更した「連珠」が競技として普及している。

結局は、ゲームを楽しむのは人間であり、ゲームのルールを作るのも人間自身である。必要とあらばルールを変更することも、スポーツの世界ではしはしば行われている。ゲームの世界も結局は、必要に応じて、適当なルールの調整を行っていくことも、また必要不可欠だと言うことだろう。仮に、完全なゲームの解析がコンピュータで行われたとしても、ちょっとしたルールの変更がこうした分析の前提を大きく変更することになり、これらの解析の意味を低下させてしまうことにもなる。こうしたルールの変更にコンピュータがどの程度柔軟に対応できるのかは分からない。いずれにしても、人間がゲームの主体である限り、人間はそうしたルール変更なども自在に行うことができ、それに対応できる柔軟性を有している。AIがいくら高度に発展し、ゲームの必勝法を解明したとしても、人間は、自分たちが決めたルールの中で、自らの頭で考え出した最善の手を尽くすことで、引き続きゲームの奥深さの魅力を感じつつ、ゲームを楽しむことができる、ということだろう。

筆者プロフィール
中村亮一（なかむらりょういち）
ニッセイ基礎研究所取締役保険研究部研究理事年金総合リサーチセンター長
研究・専門分野：保険会計・計理

Page: [1]