闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾剧懓顪冪€n亝鎹i柣顓炴閵嗘帒顫濋敐鍛婵°倗濮烽崑鐐烘偋閻樻眹鈧線寮撮姀鈩冩珖闂侀€炲苯澧板瑙勬礋瀹曠兘顢橀悩纰夌闯濠电偠鎻紞鈧柛瀣€块獮瀣攽閸愨晝鈧椽姊虹紒妯忣亪宕㈤弽顐e床闁糕剝绋掗悡蹇涙煕椤愶絿绠撻柍褜鍓欓幉锛勭矉瀹ュ绠氱憸婊冦€掓繝姘厪闁割偅绻堥妤€霉濠婂嫮绠樼紒杈ㄥ笧閹风娀鎳犻鈧埅鐢告⒑闂堟稒顥欑紒鈧笟鈧崺銏℃償閵娿儳顔掗梺鍝勵槹閸ㄥ爼鎮块崨瀛樷拻濞撴埃鍋撴繛浣冲泚鍥敇閵忕姷锛熷┑鐐叉▕娴滄粓鎮為崹顐犱簻闁瑰搫绉堕崝宥団偓瑙勬礀閺堫剟骞堥妸锔剧瘈闁告劏鏂傛禒銏ゆ⒑鐠団€虫灓闁稿繑锚椤曪綁鎳滈崹顐㈠妳闂佸湱鍋撳ḿ娆撴儊闁秵鈷掗柛灞剧懆閸忓本銇勯姀鐙呭伐闁宠绉瑰鎾閻樻鍞堕梻浣哄帶椤洟宕愬Δ鍛剹濠㈣埖鍔栭悡娆撴煟閹寸伝顏堟倶瀹ュ鐓曟い鎰靛亗闁垶鏌$仦鍓ф创妞ゃ垺娲熸俊鍫曞川椤旈敮鍋撴繝姘拺闂侇偆鍋涢懟顖涙櫠椤曗偓閺岋綀绠涢弬鍨懙闂侀潧妫楅崯瀛樹繆閻戣棄鐓涢柛灞惧焹閸嬫捇鎮滈懞銉у幘缂佺偓婢樺畷顒勫储閹间焦鐓i煫鍥ㄦ崌閸欏嫭鎱ㄦ繝鍛仩闁归濞€瀹曪絾寰勫畝濠冪倞婵犵數鍋涢悺銊у垝閻樺磭顩叉い蹇撳閸ゆ洟鎮归崶銊с偞婵℃彃鐗撻弻鏇$疀閺囩倫銉╂煕濡粯鍊愭慨濠呮缁瑩骞愭惔銏″闂備焦鎮堕崐鏇㈡煀閿濆鏄ラ柍褜鍓氶妵鍕箳瀹ュ浂妲紓浣广亞閸涱垳锛滈柡澶婄墑閸斿苯霉椤斿浜滈柕蹇ョ磿閹冲懘鏌熼崣澶嬪唉鐎规洜鍠栭、妤呭磼濮樿京袪闂傚倸鍊搁崐宄懊归崶褜娴栭柕濞炬櫆閸婂潡鏌ㄩ弴鐐测偓鍝ョ不閺屻儲鐓曢柕澶樺枛婢ь噣鏌$€b晝绐旈柡宀€鍠栧畷婊嗩槾閻㈩垱鐩弻锟犲川椤旇棄鈧劙鏌$仦璇插闁诡喓鍊濆畷鎺戔槈濮楀棔绱� 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌i幋锝呅撻柛銈呭閺屾盯骞橀懠顒夋М闂佹悶鍔嶇换鍐Φ閸曨垰鍐€妞ゆ劦婢€缁墎绱撴担鎻掍壕婵犮垼娉涢鍕崲閸℃稒鐓忛柛顐g箖閸f椽鏌涢敐鍛础缂佽鲸甯¢幃鈺呮濞戞帗鐎伴梻浣告惈閻ジ宕伴弽顓犲祦闁硅揪绠戠粻娑㈡⒒閸喓鈯曟い鏂垮濮婄粯鎷呴崨濠傛殘婵烇絽娲﹀浠嬫晲閻愭潙绶為柟閭﹀劦閿曞倹鐓曢柡鍥ュ妼閻忕娀鏌涘Δ鍕彧濞e洤锕俊鍫曞磼濮橆偄顥氭繝鐢靛仜閻°劎鍒掑澶婄?閻庡湱濮锋禍娆撴⒒娴h櫣甯涢柨鏇樺灩宀h儻顦崇紒鍌涘笒楗即宕熼埡鈧花濠氭⒑閻熸壆鎽犵紒璇茬Т鍗遍柛娑樓规禍婊堟煛閸ユ湹绨界紒瀣吹缁辨帡宕掑☉妯碱儌闂侀€炲苯澧剧紓宥呮閸┾偓妞ゆ帒顦獮鎰版煛閸涱垰鈻堢€殿喖顭峰鎾偄妞嬪海鐛繝纰樻閸ㄦ娊宕曢妶澶嬪€剁€广儱鎷嬪〒濠氭煏閸繂鏆欓柛鏃€纰嶆穱濠囶敃閿濆洨鐣靛銈庡亜缁绘帞妲愰幒鎳崇喓鎷犲顔瑰亾閹惧绠鹃柟鐐綑閸ゎ剟鏌涢妸鈺€鎲剧€殿噮鍋婇、娑橆潩閸忕厧鐦滈梻渚€娼ч悧鍡椢涘▎鎾村殐闁绘ḿ绮悡鏇熺箾閹存繂鑸归柡瀣洴楠炴牠寮堕幋顖濆惈闂佸搫鐭夌徊楣冨箚閺冨牜鏁嶆繝濠傛啗閿濆鈷戦柛娑橈攻鐏忔壆绱掔€n偅灏甸柛鎺撳笚缁绘繂顫濋鍌滄綁闂備礁澹婇崑鍡涘窗閹捐鍌ㄩ柛妤冨亹閺€浠嬫煟閹邦厽缍戦柣蹇嬪劤閳ь剝顫夊ú锕傚礈閻斿鍤曢柟闂寸劍閸嬪嫰鎮樿箛搴e妽闁哄倵鍋撳┑锛勫亼閸婃牕顫忔繝姘柧妞ゆ劧闄勯崕妤呮煙閻戞﹩娈曢柣鎾寸洴閹﹢鎮欐0婵嗘婵犳鍠栭崐鍧楀蓟閻旂⒈鏁婇柛婵嗗閸嬫挸鈹戦崱娆愭闂佸湱鍎ら崹鐔肺i崼鐔稿弿婵°倐鍋撴俊顐f⒒濡叉劙鏁撻敓锟� 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌i幋锝呅撻柛銈呭閺屻倝宕妷锔芥瘎婵炲濮靛銊ф閹捐纾兼繛鍡樺笒閸橈紕绱撴笟鍥ф珮闁搞劏娉涢悾鐤亹閹烘垹顦繛杈剧悼閹虫挻鎯旀繝鍌楁斀闁绘劖娼欓悘锕傛煟閻旀繂鎳庢慨顒勬煃瑜滈崜鐔奉潖閾忓湱鐭欐繛鍡樺劤閸撳灚绻濆▓鍨灁闁稿﹥绻堥獮鍡涘礋椤栵絾鏅梺缁樺姇瀵爼鎮楅鍕拺闁荤喐婢橀埛鏃傜磼椤曞懎鐏︾€殿喗鐓¢獮鏍ㄦ媴閸︻厼寮抽梻浣虹帛濞叉牠宕愰崷顓涘亾濮樼偓瀚�

AlphaGo为何缺席计算机围棋赛 或已是不同物种

2017年03月19日15:54 新浪体育 微博
人机大战第一季的盛况还历历在目

  3月19日,UEC杯世界围棋计算机大赛在日本结束,中国的围棋程序绝艺击败日本的DeepZenGo,取得冠军。这次比赛其实也邀请了AlphaGo,但被他们拒绝了。参赛的围棋程序大都是学习2016年DeepMind的那篇论文,而现在的AlphaGo又再度进化升级,成为更为强大的“Master”了。与参赛的围棋程序相比,现在的AlphaGo可能已经是不同“物种”了,自然没必要参赛。

  赛制并不完全“公平”

  以往的UEC杯世界围棋计算机大赛并不广为人知,今年之所以备受关注,主要是两个参赛程序的,日本的DeepZenGo和中国的绝艺。前者马上要和芈昱廷、朴廷桓、井山裕太进行世界围棋大赛,后者则一直在对弈网站上测试,积累了相当的人气。

  比赛的用时是每方30分钟,平均下来20秒左右就要落子,参赛程序的计算能力显然对比赛成绩有着很大的影响。比赛并不是所有的程序都使用统一的硬件配置,而是各自通过手里的笔记本电脑,把比赛数据发送到各自的服务器计算平台上完成。这也是为什么18日现场断网之后,比赛不得不暂停的原因。

因断网而暂停的比赛
因断网而暂停的比赛

  应用了深度学习技术的围棋程序,对局时策略网络和价值网络同时工作,还要配备强大GPU等计算资源。虽然计算资源堆积到一定程度之后能起到的提升效果有限,但在UEC的快棋赛制里,计算资源上的差别还是很有影响的。

  DeepZenGo是由日本最大的视频网站作为技术支持,而绝艺的背景是腾讯,两者在计算资源上的优势是显而易见的。据国内一位研究围棋AI的同学介绍,绝艺能够调用的计算资源大到无法想象,毕竟中国是目前超算能力最强的国家。

  所以,绝艺和DeepZenGo一路过关斩将,没有遭遇什么抵抗就打进了决赛。两者之间的对决才是真正意义上的战斗。

  DeepZenGo的“离奇”失误

  (这段内容是绝艺和ZEN的决赛棋谱分析,如果你不会下棋,可以略过,大致意思是,ZEN在局面不错的情况下,因为计算上的失误被绝艺逆转胜了。)

  决赛DeepZenGo执黑先行,右下角黑棋的死活是这盘棋优劣的关键。但绝艺和DeepZenGo后来都没有在右下角走棋,看来是对此有一致的判断,黑棋是活的(如果某方认为黑角会死,肯定早就脱先抢着走了)。右下角的变化比较复杂,这里就先不做讨论了。

图1
图1

  图1:棋局进行到中盘阶段,黑棋围棋上边大空,判断下形势,黑棋要稍占上风。

图2
图2

  图2:“绝艺”在黑棋上边空里行棋,DeepZenGo的应对很成问题,白1断的时候,黑2虎效果比实战要好不少,更关键的时候,白3顶的时候,黑棋明明可有在4位扳,这样没什么棋。

图3
图3

  图3:然而实战DeepZenGo却配合绝艺,在黑棋空里出棋了……绝艺逆转获胜!

  这盘棋DeepZenGo和绝艺到底使用了多大的计算资源我们不得而知,但很明显,这样的计算能力,DeepZenGo想在后天与人类世界冠军的对抗中占到上风,几乎是不可能的。现在已经不是一年前了,人类棋手们已经对围棋人工智能不再陌生。

  与现在的AlphaGo可能不是同一“物种”

  绝艺、DeepZenGo,还有此前新浪棋牌报道过的 “丽拉”,都是受到2016年DeepMind在《自然》杂志上发表的关于AlphaGo论文启发,进而发展成现在的围棋人工智能的。从某种意义上讲,它们都是去年那个AlphaGo的跟随者。从这次世界计算机大赛的棋谱体现出的水平来看,他们距离去年击败李世石的那一版AlphaGo似乎还有一定的差距。

改变了围棋界的论文
改变了围棋界的论文

  这个差距一方面来自于,当时AlphaGo与李世石下的是慢棋,计算时间比这次要长;另外一方面可能是谷歌在深度学习技术应用上的优势所致。

  不过尤其要注意的是,现在这些围棋程序对比的对象还只是2016年与李世石大战的AlphaGo,现在的AlphaGo(或者说MAster)究竟进化到什么程度我们并不知道。

  DeepMind在公布科学成果上是很谨慎的。去年人机大战之前他们说AlphaGo通过自我对弈,取得了巨大的进步,所以才有信心挑战李世石。当时不少人对此嗤之以鼻,结果被4比1的比分打了脸。

樊麾微博截图
樊麾微博截图

  2016年11月的时候,AlphaGo团队的发言人樊麾通过微博宣布:“我们很高兴向大家宣布,AlphaGo的棋力在已过半年有巨大的进步,将在2017年初复出下棋。我们团队会在近期内公布更多讯息。”这个“巨大进步”耐人寻味,AlphaGo的研究又取得了怎样的进展呢?之后Master在网上的60盘快棋测试,让我们惊鸿一瞥。计算时间极短、完美的局面掌控、精准的局部战斗,这些细节都告诉着我们,现在的AlphaGo或者说Master,已经和一年前的它完全不同了,甚至可能已经进化到了一个更为先进的阶段。

  上一次AlphaGo公布研究结果,改变了整个围棋人工智能领域,为围棋界打开了一道通往未来的大门。不久前,哈萨比斯说:“2017年将是AlphaGo与棋界兴奋的一年”,这次他们会带来什么样的惊喜呢?

哈萨比斯和李世石
哈萨比斯和李世石

  (周游)

标签: 围棋AlphaGo计算机围棋
0条评论|0人参与我有话说
分享到微博
发布
最热评论 刷新