AlphaGo为何缺席计算机围棋赛 或已是不同物种
3月19日,UEC杯世界围棋计算机大赛在日本结束,中国的围棋程序绝艺击败日本的DeepZenGo,取得冠军。这次比赛其实也邀请了AlphaGo,但被他们拒绝了。参赛的围棋程序大都是学习2016年DeepMind的那篇论文,而现在的AlphaGo又再度进化升级,成为更为强大的“Master”了。与参赛的围棋程序相比,现在的AlphaGo可能已经是不同“物种”了,自然没必要参赛。
赛制并不完全“公平”
以往的UEC杯世界围棋计算机大赛并不广为人知,今年之所以备受关注,主要是两个参赛程序的,日本的DeepZenGo和中国的绝艺。前者马上要和芈昱廷、朴廷桓、井山裕太进行世界围棋大赛,后者则一直在对弈网站上测试,积累了相当的人气。
比赛的用时是每方30分钟,平均下来20秒左右就要落子,参赛程序的计算能力显然对比赛成绩有着很大的影响。比赛并不是所有的程序都使用统一的硬件配置,而是各自通过手里的笔记本电脑,把比赛数据发送到各自的服务器计算平台上完成。这也是为什么18日现场断网之后,比赛不得不暂停的原因。
应用了深度学习技术的围棋程序,对局时策略网络和价值网络同时工作,还要配备强大GPU等计算资源。虽然计算资源堆积到一定程度之后能起到的提升效果有限,但在UEC的快棋赛制里,计算资源上的差别还是很有影响的。
DeepZenGo是由日本最大的视频网站作为技术支持,而绝艺的背景是腾讯,两者在计算资源上的优势是显而易见的。据国内一位研究围棋AI的同学介绍,绝艺能够调用的计算资源大到无法想象,毕竟中国是目前超算能力最强的国家。
所以,绝艺和DeepZenGo一路过关斩将,没有遭遇什么抵抗就打进了决赛。两者之间的对决才是真正意义上的战斗。
DeepZenGo的“离奇”失误
(这段内容是绝艺和ZEN的决赛棋谱分析,如果你不会下棋,可以略过,大致意思是,ZEN在局面不错的情况下,因为计算上的失误被绝艺逆转胜了。)
决赛DeepZenGo执黑先行,右下角黑棋的死活是这盘棋优劣的关键。但绝艺和DeepZenGo后来都没有在右下角走棋,看来是对此有一致的判断,黑棋是活的(如果某方认为黑角会死,肯定早就脱先抢着走了)。右下角的变化比较复杂,这里就先不做讨论了。
图1:棋局进行到中盘阶段,黑棋围棋上边大空,判断下形势,黑棋要稍占上风。
图2:“绝艺”在黑棋上边空里行棋,DeepZenGo的应对很成问题,白1断的时候,黑2虎效果比实战要好不少,更关键的时候,白3顶的时候,黑棋明明可有在4位扳,这样没什么棋。
图3:然而实战DeepZenGo却配合绝艺,在黑棋空里出棋了……绝艺逆转获胜!
这盘棋DeepZenGo和绝艺到底使用了多大的计算资源我们不得而知,但很明显,这样的计算能力,DeepZenGo想在后天与人类世界冠军的对抗中占到上风,几乎是不可能的。现在已经不是一年前了,人类棋手们已经对围棋人工智能不再陌生。
与现在的AlphaGo可能不是同一“物种”
绝艺、DeepZenGo,还有此前新浪棋牌报道过的 “丽拉”,都是受到2016年DeepMind在《自然》杂志上发表的关于AlphaGo论文启发,进而发展成现在的围棋人工智能的。从某种意义上讲,它们都是去年那个AlphaGo的跟随者。从这次世界计算机大赛的棋谱体现出的水平来看,他们距离去年击败李世石的那一版AlphaGo似乎还有一定的差距。
这个差距一方面来自于,当时AlphaGo与李世石下的是慢棋,计算时间比这次要长;另外一方面可能是谷歌在深度学习技术应用上的优势所致。
不过尤其要注意的是,现在这些围棋程序对比的对象还只是2016年与李世石大战的AlphaGo,现在的AlphaGo(或者说MAster)究竟进化到什么程度我们并不知道。
DeepMind在公布科学成果上是很谨慎的。去年人机大战之前他们说AlphaGo通过自我对弈,取得了巨大的进步,所以才有信心挑战李世石。当时不少人对此嗤之以鼻,结果被4比1的比分打了脸。
2016年11月的时候,AlphaGo团队的发言人樊麾通过微博宣布:“我们很高兴向大家宣布,AlphaGo的棋力在已过半年有巨大的进步,将在2017年初复出下棋。我们团队会在近期内公布更多讯息。”这个“巨大进步”耐人寻味,AlphaGo的研究又取得了怎样的进展呢?之后Master在网上的60盘快棋测试,让我们惊鸿一瞥。计算时间极短、完美的局面掌控、精准的局部战斗,这些细节都告诉着我们,现在的AlphaGo或者说Master,已经和一年前的它完全不同了,甚至可能已经进化到了一个更为先进的阶段。
上一次AlphaGo公布研究结果,改变了整个围棋人工智能领域,为围棋界打开了一道通往未来的大门。不久前,哈萨比斯说:“2017年将是AlphaGo与棋界兴奋的一年”,这次他们会带来什么样的惊喜呢?
(周游)