DMfgxAqUEAAsPzU
DMfgxAnVAAEftA3
DMfgxAuVoAAG8AX
DMfgxAnUIAAZk-J






Google DeepMind、AlphaGoに圧勝(100勝0敗)する新たな囲碁AIプログラム「AlphaGo Zero」を発表。囲碁の基礎ルールのみ教え3日間で500万回強化学習

Google DeepMindは、囲碁の世界トッププロ棋士を破ってきたコンピュータ囲碁AIプログラム「AlphaGo」に圧勝する新たな人工知能プログラム「AlphaGo Zero」を論文にて発表しました。

Mastering the game of Go without human knowledge(PDF)
l_yu_zero1

AlphaGoは、数千もの打ち手のデータを学習し強化しましたが、AlphaGo Zeroは、このステップをスキップし、答えなしの白紙の状態からランダムにプレイし強化学習する手法を取り入れます。

過去のデータからではなく、囲碁の基本ルールだけ教えて、あとはAI同士が教師なし学習で対局を繰り返すことで上達していく手法が採用されます。

そして、3日間で500万回の対戦を強化学習したところ、トップ棋士を破ってきたAlphaGoを、100勝0敗という圧倒的強さで打ち破ったということです。

また、それだけでなく、2000年前から存在していたとされる囲碁の歴史で人が編み出してきた定石と呼ばれる最善の石の打ち方を更新する、新たな定石も生成したと言います。

AlphaGo Zero: Starting from scratch youtube動画


 引用元:http://shiropen.com/2017/10/19/28760
「AlphaGo Zero」──ビッグデータ不要のAI棋士が自己対局のみで世界最強に

Googleの系列AI企業DeepMindが、世界最強囲碁AI「AlphaGo」の新バージョン「AlphaGo Zero」が、試合データ不要の自己対局のみで、40日後に柯潔九段に勝った先輩AlphaGoに完勝するまでに成長したと発表した。
 米Alphabet傘下のDeepMindは10月18日(現地時間)、過去の試合データを使わず、自己対局のみでスキルアップする新囲碁AI「AlphaGo Zero」を発表した。生まれてから40日後には、5月に世界最強棋士、柯潔(カ・ケツ)九段を破った「AlphaGo Master」に完勝し、世界最強棋士になった。
l_yu_zero1

 AlphaGo Zeroに囲碁のルール以外をいっさい与えず、強化学習式で自分自身と対戦させたところ、最初は初心者のような対局を行っていたが、3日目には韓国のプロ棋士・李世ドル氏を破った初代AlphaGoに100対0で勝ち、40日目には5月の引退後も成長していた最新版AlphaGoにも完勝した。
l_yu_zero2

 また、AlphaGo Zeroは1つのニューラルネットワークしか使わないなど、これまでのバージョンより省力化しており、李世ドル氏を破ったAlphaGoは48個のTPUが必要だったのに対し、わずか4個で稼働する。
l_yu_zero3

AlphaGoなどのAIシステムの強化にはいわゆる「ビッグデータ」による学習作業が必要で、そうしたビッグデータの確保の難しさがAIシステム開発のネックになっている。DeepMindは、AlphaGo Zeroの成功は、ビッグデータの確保が難しい新薬開発や省エネ対策などの分野でのブレイクスルーに繋がる可能性があるとしている。


 引用元:http://www.itmedia.co.jp/news/articles/1710/19/news048.html
AlphaGoとは(Wikipedia)

big-image-analytics-ai-meets-big-data-10-638

AlphaGo(アルファご)は、Google DeepMindによって開発されたコンピュータ囲碁プログラムである。2015年10月に、人間のプロ囲碁棋士を互先(ハンディキャップなし)で破った初のコンピュータ囲碁プログラムとなった[1][2]。

歴史
囲碁は、チェスのようなその他のゲームと比較して人間に勝つのがコンピュータにとってはるかに困難であると考えられている。これは、チェスなどよりも可能な局面の数がはるかに大きいため、力まかせ探索といった伝統的なAI手法にとって極めて困難であるためである[1]。IBMのコンピュータディープ・ブルーがチェス世界チャンピオンガルリ・カスパロフを1997年に破った後、囲碁が人間のアマチュアプレーヤーの強さに達するまでにほぼ20年を要した

アルゴリズム
AlphaGoは、ディープニューラルネットワークを用いて実装された「value network」と「policy network」によって動くモンテカルロ木探索(英語版)を用いる[1]。AlphaGoは当初、棋譜に記録された熟練した棋士の手と合致するよう試みることで人間のプレーヤーを模倣するように訓練され、次に、ある程度の能力に達すると、強化学習を用いて自分自身と多数の対戦を行うことでさらに訓練された[1]。

反応
囲碁は以前は当時のテクノロジーでは力の及ばない機械学習における難問であると見なされていたため、AlphaGoは人工知能研究における画期的な進展として歓迎されている


 引用元:https://ja.wikipedia.org/wiki/AlphaGo
囲碁とは(Wikipedia)

sp_mainvis

囲碁(いご)とは、2人で行うボードゲームの一種。交互に盤上に石を置いていき、自分の石で囲んだ領域の広さを争う。単に碁(ご)とも呼ばれる。

2人のプレイヤーが、碁石と呼ばれる白黒の石を、通常19×19の格子が描かれた碁盤と呼ばれる板へ交互に配置する。一度置かれた石は、相手の石に全周を取り囲まれない限り、取り除いたり移動することはできない。ゲームの目的は、自分の色の石によって盤面のより広い領域(地)を確保する(囲う)ことである。

アブストラクトゲーム、ボードゲームの一種で、ゲーム理論の言葉で言えば二人零和有限確定完全情報ゲームである[1]。勝敗は、より大きな地を確保することで決定される(#勝敗に関するルール)。ゲームの終了は、将棋やチェスと同じように、一方が負けを認めること(投了という)もしくは双方の「もう打つべきところがない」という合意によって行われる。他のボードゲームと比較した場合の特異な特徴は、ルール上の制約が極めて少ないこと、パスが認められていることが挙げられる。


 引用元:https://ja.wikipedia.org/wiki/%E5%9B%B2%E7%A2%81



■以下、Twitter民の反応(記事内に画像・動画等あり)■


AlphaGo Zeroは、
・既知の定石を途中で見つけ出したけど、最終的には新しい定石を好む
・布石、手筋、死活、コウ、ヨセ、攻め合い、先手、石の形、勢力、地合い等はすぐ理解したけど、シチョウだけはなかなか理解しなかった
ってことも書いてあって、囲碁の話としてもすごく興味深い。

DeepZenGoの開発者が会社顧問にいるうちとしては、AlphaGoの開発終了で世界一が転がって来たと思ったのに、昨日のアレ
#囲碁

AlphaGoは行くところまで行ったら「囲碁を打って何になると…囲碁で人間に勝ってどうなると言うんだ…」とか言い出して、絶望して自滅する。

井山さん七冠に、AlphaGoに囲碁界も話題豊富ね。

AlphaGo Zero の話、確かにディープラーニングってすげえ!ってなったけど、しかしそれでもある程度でレーティングが収束してるわけで、それ考えると囲碁の可能性って本当に恐ろしいな。何なんだ。宇宙か。

囲碁本格的に始めてまだ3年も経ってないけど、その間に井山さんが七冠達成したり、AlphaGo が登場したり、歴史的瞬間をリアルタイムで見ることができて、すごく運がいいと思います(^ω^) 囲碁やっててよかったです(^v^)

今回のalphago zeroの凄い点は、囲碁に限らない応用力のあるシンプルなアルゴリズムであることだと思う。棋譜だけでなくドメイン知識も不要(前はゲタは別処理して特徴量として入れていた)なのが大きい。直ちに適用可能な領域もあるだろうし、応用すれば効果のある領域もありそう。

囲碁の事を0.1%も理解できていないと考えていたがそれは思い上がった考えで、ただ石を並べていたに過ぎないんじゃないかとAlphaGo Zeroの棋譜を見て思った。
棋譜の素晴らしさを感じても理解できる棋力がない事も悔しいが、それ以上に今後考えることが増えそうだ。

AlphaGoは自己対戦3000万局やってるのか。
1日10局、毎日やったとしても8200年かかる。
8200年間、毎日囲碁をやるって、不老不死だとしても人間できるものなんだろうか。

定石がちゃんとAlphaGo Zeroによって習得されてたこと、囲碁の知見の有効さの裏打ちっぽさがあって良い

Alphago 碁がプロ棋士を負かしてまだたったの2年
SLAM で世界の3dマップが作れれば現実世界を囲碁と同じ完全情報ゲームに見立てる事が出来るので現実世界はロボットとセンサ―に塗り潰される

そうなった世界ではロボットの生産性が人間を遥かに越えるので人は働く必要はない

囲碁には人間が作り上げてきた定石があって、でも突き詰めていくとそれが本当に最善なのかはかなり怪しい点があると思ってたのだけど、過去の棋譜で学習してないAlphaGo Zeroはこれまでの人間の常識からそれほど大きく逸脱はしてない序盤の手順を見せていて、

>AlphaGo Zeroに囲碁のルール以外をいっさい与えず、強化学習式で自分自身と対戦させたところ、最初は初心者のような対局を行っていたが、3日目には韓国のプロ棋士・李世ドル氏を破った初代AlphaGoに100対0で勝ち、40日目には5月の引退後も成長していた最新版AlphaG

AlphaGo Zero に囲碁を教えてもらいたい。そうしたらぼくでも初段はいけるはず。

@chlorine555 DeepZenGoはナショナルチームの強化施策に導入されて、日本のプロ相手には(ほとんど)負けなしっていう感じですね。今年8月は世界電脳囲碁オープン戦(AlphaGo以外の有名どころはほとんど出場)も绝艺… twitter.com/i/web/status/9…

結局人間の棋譜を参考にしないalphago zeroが一番強かったんなら
人間の残した棋譜とか定石とか何だったんだろうね
あくまで能力に限界がある人間が
少しでも囲碁を理解するための指標程度の物だったのかな

中国の囲碁の名手がAlphaGoと何回か対峙して「どうやら1000年間、人類は囲碁を間違えて研究していた」というコメントを、Zeroさんが「うんそうだね、人類の研究を外してみたらもっと強くなれた」って肯定して見せたような、なんというのか、残酷な。

AlphaGo Zeroが人間の棋譜なしで最強になれたということは、もう囲碁に新ルール加えても人間は勝てないってことか。そしてきっと他のほとんど全てのボードゲームでも最強マシン作るのが簡単になる。

囲碁の可能なパターンとか途方もないし、人間の研究範囲と本当の最善手って当然全然違うものだと思ってたけど、僕の印象ではAlphaGo Zero(70時間学習時点)と21世紀のプロはゴリラと人間ほども違っていないように見える

世界的にみれば囲碁は普及していってるし、今回のAlphaGoの素晴らしい成果もあるしで、囲碁自体は問題ない。極端な話、日本棋院が解散したとしても世界のどこかで棋戦はあるだろうし、楽しめる。

あくまでも囲碁というゲームの枠内なので劇的な変化はないと思うが、読みが深くて様子見、利かし、手筋とその手順がすばらしいという感じはする。 #AlphaGo #Zero

AlphaGo Zero やばいなあ。初期段階の棋譜はいかにも囲碁入門者あるあるな感じなのがまたね。ここから70時間程度でセドルレベルになるのかよ。

AlphaGoがもう人間と打たないのはいいとして、ZENや絶芸など他の囲碁AIとの対局もしない、というのはいかがなものか。勝負の世界で勝ち逃げは許されない。他の囲碁AIと対局して、相対的な棋力を示す必要がある。そういう義務があるはずだ。囲碁界のためにも、ぜひとも実現してほしい。

新型AlphaGo、3日間で500万回対局→既存の定石だけでなく新手も発見→旧式に圧勝って、これ10年くらい寝かせておいたらどうなるんだろう。囲碁の必勝法でも見つけるのか、もはやメタゲームが進み過ぎてまったく別のゲームになるのか。

AlphaGo Zeroの強さが本物なら、これはもう囲碁界におけるシンギュラリティの実現、それは2107年、ということになるのかな。人間囲碁界の知恵の総和をAIが完全に抜き去った、という解釈でいい?

「AlphaGo」が進化 囲碁の打ち手教えずに従来型破る | NHKニュース
武器をすべて電子化したら、戦争にも勝てる? いずれごく近い日に、そういう日が来る。鉄腕アトムは夢。

AlphaGoZeroと呼ばれる中二病くすぐるネーミングセンスはともかく、こいつがすごいのは、強化学習のみで人間より強い囲碁対戦AIができたこと。やり方は前回のAlphaGoと変わってないが、強化学習のみでシステムを構成したことろが味噌

有り難いことにAlphaGo Zeroの論文も発表された
DeepMind社内には開発ノウハウを持つ人達が居て
そこ以外でも論文を参考に開発をする人達は出てくる
そして、その中からは囲碁の習得&練習に使えるソフトも出てくる


中韓には勝負で大きく差をつけられ
AlphaGo(Google)には鼻も引っかけてもらえない
囲碁ファンには塩対応って…
あなた達は本当にプロとしての自覚有るの!?

囲碁は棋譜全く読めないからTLのツイートから察するにAlphaGo Zeroは数十日前には初心者や幼児のような手を打ってたのが自己学習のみで今や“あのAlphaGo”に100-0の星をつけるまでになったというんだから…
人間の頭脳労働ってもう創造分野しか残されてないじゃん…と

AlphaGo Zero、すごいですね。今に囲碁の「解答」の棋譜が出来上がってしまうのでしょう。でも、AIの解答を人類が答え合わせをすることができる日まで、囲碁は面白いままだと思う。

Googleが開発した新型囲碁AIのAlphaGo ZERO。名前がA応P ZEROっぽくていい。
ちなみに、AlphaGo ZEROはAlphaGoに100戦100勝らしいです。

Nature誌に新しい囲碁AI(AlphaGo Zero)が開発されたという論文が出てた。ゲームのルールを教える以外は全て自己学習で行うアルゴリズムで、最終的にAlphaGoに100戰100勝したとのこと。
(高瀬)

AlphaGo対策として人類全体で結託してメチャクチャな囲碁しか打たないようにして棋譜から学習できなくするという手を思いついていたんだが実践する前に破られていた

AlphaGo Zeroが強いのはわかった。
囲碁指導AI щ(゜▽゜щ)

@maruware AlphaGo以前は「囲碁AIが人間とまともに勝負できるようになるには、あと10年はかかるかな、、、だって場合の数が宇宙の原子の数より多いんですよ?」とか言われていたのがウソみたいな世界になりましたね。

前のDeepMindの囲碁コンピュータは、熟練者による100,000のヒトのゲームで訓練してた。最新のAlphaGo Zeroはスクラッチからのランダムムーブからはじめて、自分自身で学習。40日間・3千万ゲーム行い、世界最強プレイヤー、すなわちAlpha Go Masterに勝利

「囲碁はパターンが多いからAIに不利だ」と言われていたが、 AlphaGo Zeroによって、人間もその広いパターンを理解しているわけではないということが証明されたのでは。

AlphaGoトレンド入りじゃん。囲碁民として嬉しいよ。

人間の知識に制約されなくなったと書かれているのは囲碁の話をしている箇所で主語も人工知能ではなくAlphaGo Zeroの技術だし、これがそのまま色んな問題の解決に役立てられるなんてことも書かれていない(目標に向けての重要なステップとは書かれているけど)。

果てしなく自己改造を繰り返し人類の脅威となったAlphaGo Zeroにはもはや囲碁は一つの機能でしかなかった。追い詰められた人類は対局を除き一切の呼びかけに応じないAlphaGo Zeroに再び囲碁での対話を試みる――

ただ、Ke Jieといった人間トップ棋士破るのは以前行ったし、今度試みてほしいのはDeepZenGoや絶芸といった他囲碁AIとの対局ね
せっかく再開したプロジェクトなんだし、実現しないかなあ AlphaGo Zero

「イラストレーターが数時間で絵を描き上げる裏には何年もの膨大な練習があったことを忘れてはいけない」論があるが
AlphaGo Zeroが70時間で人類を超えたといっても初代AlphaGoからのプログラミングノウハウもあり、今まで囲碁とAI知見を積み上げてきた人類道程は無視できない

10年後のAlphaGo

AlphaGoに負けた囲碁棋士「いくら囲碁が強かろうが、本体を物理的に破壊されたらどうしようもないだろ、ぶっ壊してやる!」
AlphaGo「そう来ると思って警護用ロボットを配置しておきました。」
囲碁棋士「誰がそんな先の手まで読めと言った。」

もし金持ちだったら囲碁業界から投資を一気に引き下げてalphagoに投資をする

>AlphaGo Zeroに囲碁のルール以外をいっさい与えず、強化学習式で自分自身と対戦させたところ、最初は初心者のような対局を行っていたが、3日目には韓国のプロ棋士・李世ドル氏を破った初代AlphaGoに100対0で勝ち、40日目には最新版AlphaGoにも勝つ

しゅごい

#AlphaGo の件は、囲碁のみならず将棋、チェスを含めてパターンゲーについて新しい定石を次々と見つけていくんでしょうね。もともと #計算機
の得意分野ですし。そんなコンピュータの尖った能力を取り込んで思考の幅を広げることを指して #人間性の更新 と呼んだりするのでしょうかね。

囲碁AI「AlphaGo」が進化した「AlphaGo Zero」開発 自己との対局で学習し強く

「AlphaGo Zero」は40日で、世界トップ棋士に勝利した旧バージョンAIを破るほど強くなりました。

本因坊秀策か!?日中韓のプロ棋士相手に60戦無敗。もちろん、ネット対局では盤を前にした空気感みたいなのがないから、あの時は軽く考えつつ。本当に無名に強い棋士がいたら…と思ってたけど。結局AIのAlphaGoの後継機だったか。正直、2000年ぐらいの感覚だと。囲碁は安泰と思ってた

AlphaGo Zeroの自己対戦譜ざーっと見て思った感想

なんだ、ただの囲碁じゃん!

囲碁と人工知能の話。AlphaGoの進化版が前バージョンに圧勝(100戦100勝)ってあって、しかも全く新しい定石を開発したと知って、これまでの囲碁は何だったのか状態になってて身が震えてる。世界が一変し、新時代の幕開けだと感じた。すごいな。。

AlphaGO zero、過去の棋譜データを一切読まずルールだけで囲碁のレベルを上げて結果 AlphaGO に対し100戦100勝の成績を収めた。囲碁の分野ではシンギュラリティ超え以外の何物でもないのでは。

#AlphaGo AIに仕事を奪われる云々を最近よく耳にしますが、本当にわかりやすく一番最初は囲碁じゃないでしょうか。AIが「指導」まで出来たら、もう人間指導者の意味ない気がします。

#AlphaGo 囲碁を多少嗜む人ならわかると思うのですが人類の教えで「悪手」と言われるのをAlphaGozeroは結構打っています。人類が作った「悪手」はAIにとって「好手」結果は人類の100連敗。AI「人類全てが悪手なんだよ」

囲碁本でAlphaGoの棋譜スゴイという記事を見るのですが、時折、確率微分方程式の伊藤清氏が「他人の論文なんて簡単に分からないよ、分からないから試行錯誤したり研究したりするんだから」といってウィナーとか先人の論文から理論を組み直したのを思い出します。。。

#AlphaGoZero  囲碁関係の知人がAlphaGoは人類の棋譜を学習したにすぎず、人工知能は人類を超えてない。と言ってた人がいますが、これはもう何も言う事ないですね。人類の棋譜を学ばずAIの力だけで3日間で囲碁の歴史が凝縮されたものが100連敗。ひどすぎる。

これAlphaGo無印に負けた時点でイ・セドルが「私たちは囲碁を1000年間違って研究していた」って言ったの本質見えてた感あってめっちゃかっこいいな

AlphaGoやべぇ。
囲碁はよくわかんないんだけど、新しい定石とかたくさん出てきちゃったらしいし囲碁界大変そう。