日本人工智能DeepzenGo要么墊底,要么奪冠

記者謝銳報(bào)道 3月21日,人工智能和人類平等競(jìng)技的“世界圍棋精英賽”將在日本大阪打響。日本開(kāi)發(fā)的圍棋人工智能程序DeepZenGo將與中日韓三國(guó)頂尖高手進(jìn)行人機(jī)大戰(zhàn),參賽的三國(guó)棋手分別是:中國(guó)棋手等級(jí)分第3的羋昱廷九段、日本六冠王井山裕太九段和連續(xù)40個(gè)月占據(jù)韓國(guó)棋院排名榜首的樸廷桓九段。
2016年3月谷歌“阿爾法狗”對(duì)李世石九段4比1大勝、一戰(zhàn)成名后,人工智能何時(shí)再與人類高手進(jìn)行對(duì)抗尚在策劃中,但倍感意外的是一向以思想保守、行動(dòng)遲緩著稱的日本棋界竟然捷足先登,首先于2016年底舉辦了一場(chǎng)趙治勛九段對(duì)DeepZengo的三番棋大戰(zhàn),趙治勛2比1艱難取勝;隨后更是宣布于2017年3月舉行為DeepZengo量身打造的“世界圍棋精英賽”,將DeepZengo視作與世界一流高手等列的精英地位,冠亞獎(jiǎng)金分別高達(dá)3000萬(wàn)、1000萬(wàn)日元,這正好是8年前日本主辦的豐田杯世界圍棋大賽冠軍獎(jiǎng)金數(shù)額,也相當(dāng)于當(dāng)今三星杯、LG杯、百靈杯、Mlily夢(mèng)百合杯冠軍獎(jiǎng)金額。
但相比32強(qiáng)參賽、總共要進(jìn)行5輪比賽爭(zhēng)奪的幾大世界圍棋公開(kāi)賽,僅有4位參賽者的“世界圍棋精英賽”獎(jiǎng)金實(shí)在豐厚。
此次比賽賽制為循環(huán)賽,DeepZenGo和中日韓頂尖棋手進(jìn)行單循環(huán)賽,同分則加賽爭(zhēng)冠,這場(chǎng)比賽最大的看點(diǎn)在于:DeepZenGo最終排名第幾。從2016年12月29日至2017年2月15日,DeepZenGo在弈城網(wǎng)每天24小時(shí)不眠不休共下了49天的測(cè)試對(duì)局。總局?jǐn)?shù)為1622局,勝1316局、負(fù)306局,勝率達(dá)到81.1%。其中對(duì)職業(yè)棋手615勝250負(fù),勝率71.9%,對(duì)業(yè)余強(qiáng)豪701勝66負(fù),勝率91.4%。
從超過(guò)千局的對(duì)弈結(jié)果來(lái)看,DeepZenGo對(duì)業(yè)余棋手幾乎可以保證勝利,在弈城舉行的特別十盤(pán)棋對(duì)抗賽中,Deepzengo對(duì)10個(gè)最高水平的業(yè)余高手只輸了2局。對(duì)一般職業(yè)棋手勝率尚可,但也經(jīng)常輸。對(duì)一線高手是輸面大,雖然有時(shí)也能勝。頂尖高手層面中,僅有陳耀燁九段、連笑八段等極少數(shù)棋手與其交過(guò)手,因此不足以反映出其真是水準(zhǔn)。
DeepZenGo要達(dá)到谷歌Alphago和騰訊絕藝這樣的水平,必須在瓶頸上取得突破,但有專家在網(wǎng)上寫(xiě)道,其開(kāi)發(fā)歷程過(guò)去是人工寫(xiě)搜索代碼、植入圍棋開(kāi)局與棋形知識(shí),此開(kāi)發(fā)風(fēng)格不易轉(zhuǎn)型到靠多個(gè)服務(wù)器暴力機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí)的路線上來(lái)。將策略網(wǎng)強(qiáng)、價(jià)值網(wǎng)絡(luò)等先進(jìn)武器加進(jìn)來(lái)后,Zen的實(shí)力提升很快。但之后再要提升,之前的代碼反而變成拖累。
臨開(kāi)賽前一段時(shí)間,DeepZenGo還在網(wǎng)上大量練手,只是找不到柯潔九段這等級(jí)別的高手與之對(duì)弈。在這段時(shí)間里,DeepZenGo要么取得突破,與Alphago、絕藝一樣與頂尖高手平起平坐,甚至還要高出一籌;要么原地踏步,在一流棋手與超一流棋手之間徘徊。
中日韓三位參賽棋手之間戰(zhàn)績(jī)分別是,羋昱廷對(duì)樸廷桓2勝4負(fù),對(duì)井山裕太1負(fù),樸廷桓對(duì)井山裕太的戰(zhàn)績(jī)是2勝2負(fù)。因比賽每方用時(shí)多達(dá)3小時(shí),如果Deepzengo仍無(wú)突破的話,這個(gè)比賽用時(shí)對(duì)人類有利,Deepzengo排名墊底的可能性更大。