人工智能为围棋铺路 未来以加速度呼啸而来

2017年05月27日21:55 经济日报 微博
未来赢了

  揪头发、摘下眼镜捂住面孔、无意识地搅动棋盒中的棋子……尽管在社交网络上,柯洁这几天在棋盘边的小动作被做成了各种欢乐的表情包,但现场气氛寂静、压抑而令人揪心。

  大屏幕上的镜头切换到对他左手的特写,手腕上护身符一般从小戴到大的银镯子闪闪发亮,长考之后,柯洁落子。

  人机大战第三盘,第108手。

  仅仅42秒后,棋盘对面替AlphaGo落子的人肉臂黄士杰面无表情的落下了黑子,第109手。

  不到20岁的“世界围棋第一人”,静静离开了自己的座位,整整15分钟。回来时嘴角抽搐,脸上的表情仿佛哭泣。

  “他还在奋战,这就不容易。”在观战大厅担任现场大盘讲解的国家围棋队总教练俞斌这样点评。

  胜负正在失去悬念。职业棋手胡耀宇表示:“今天他的招法思路很灵活,是有意下成第二盘的样子,可惜没有如愿。”

  但柯洁又坚持了50分钟,14点09分,柯洁投子。“AlphaGo vs KeJie 3:0”的大字打在观战大厅的大屏幕上。

  这场比赛,柯洁用时137分钟32秒,平均每手用时85秒,比第一盘每手用时多16秒,而他的对手用时仅有54分钟,平均每手不到31秒,比第一盘还快了7秒。

  这种用时上的差距,正是本次人机大战的某种写照。第一盘和第三盘,尽管结果分别是AlphaGo以四分之一子(围棋比赛中最小的差距)胜和中盘胜,但其实过程并没有本质的差别,棋局早早进入了AlphaGo的步调,柯洁种种灵活拼搏,AlphaGo看似步步退让,但结果无法动摇。

  作为“AlphaGo之父”的DEEPMIND创始人哈萨比斯,在回答“AlphaGo后半盘是否在退让”时表示,AlphaGo总要将其获胜概率最大化,所以要确定最少风险的获胜机会,知道如何扩大获胜的比例,目标是赢得这个比赛,所以重点是降低风险。

  唯一可能的机会出现在第二盘,在被国家围棋队领队华学明称为“热血沸腾”的这盘棋中,按照哈萨比斯的说法,前100步是目前为止人类和新版本阿尔法围棋对局中最接近的局势。在中盘的战斗中,全盘至少有10块未活之棋绞杀在一起,那时柯洁捂住了胸口。后来他说,这个动作是因为觉得有机会了,“有一个劫争,它撑着不补。这违背了阿尔法围棋简单获胜的原则,我当时非常震惊,心一直跳。”但一切因少年漏算了对方一枚劫材倏忽而逝。

  这次0:3,去年1:4,但不一样的,却并非仅仅是人类棋手少胜一局而已。

  从去年的爱称“狗狗”到如今的敬称“阿老师”,AlphaGo的“江湖地位”已不可同日而语。去年3月的人机大战第四盘,受到李世石78手“神之一手”压迫,AlphaGo还曾经连出“昏招”。但到了年底,新版本AlphaGo化名Master在围棋网站中横扫职业高手获得60连胜,甚至其中两盘棋,因为工程师操作失误出现了“滑标”,下错一手后,人工智能仍然获得了胜利。

  在此次“人机大战”期间,AlphaGo的技术负责人大卫·席尔瓦表示,和李世石对战的版本有12层神经网络,但与柯洁对战的这一版则有40层,更重要的是,通过大量强化学习的自我对弈,其用来选点的策略网络和用来判断胜率的价值网络都在大幅度优化,它甚至形成了类似于人类棋手在形势判断上的“直觉”,甚至学会了以类似于人类棋手“复盘”的形式检讨此前的棋招得失。新版本的AlphaGo能让旧版阿尔法围棋三子(这相当于职业九段与业余5段之间的水平差异),但新版能耗和计算力的耗费都仅相当于旧版的十分之一。一言以蔽之,人工智能正在变得更简单、更聪明、更便宜。

  作为竞技,胜负决定一切,“阿老师”的实力增长,直接改变着棋手们的态度。去年“人机大战”过程中曾态度激烈地在微博上表示“AlphaGo能战胜李世石,但战胜不了我!”的柯洁,在第一盘比赛后说的颇为直白:“和AlphaGo对战三盘是我活到现在最大的荣幸。但这大概是我和人工智能下得最后三盘棋,因为和人工智能下棋,差距会越来越大,我们的胜率会无限接近于零。”

  这些从少年时就开始纵横于黑白十九路之间的天才们甚至开始比起自己,更相信AlphaGo对形势的判断。参加此次两组棋手与AlphaGo搭档进行“配对赛”的职业棋手连笑,在第126手选择了打将,将复杂局面下的决断交给AlphaGo选择,他甚至说:“AlphaGo像一颗定心丸,我看它很稳健,慢慢一步一步下,就觉得,它对形势判断还没那么悲观,棋就还有的下,如果它特别拼搏,那大概就完了。”

  甚至连“吃瓜路人们”的想法也在变,去年“人机大战”,社交网络上最流行的段子是“有人从未来穿越回来捣毁AlphaGo,避免人类毁灭”,而今年大“火”的则是团体赛世界冠军们投子前的“集体笑场”。普通人与人工智能之间,也从应激的警惕隔膜,变得习以为常。

  但不变的仍有掌声。

  去年的人机大战里,在第四局比赛之后,记者们将长久的掌声送给了获胜的人类棋手李世石。在这一次三番棋结束之后的赛后总结上,在柯洁开口说话前,记者们依然毫不吝啬地给出了长达20多秒的掌声。少年从椅子上站起来,深深地鞠下一躬。

  “我不想说这是一个双赢的局面,输了真的很难过,我发挥的很糟糕,以后肯定也没有这机会了,我觉得真是蛮遗憾的,它的棋有一半我猜得到,另外一半猜不到,这就是我和它的差距。” 柯洁语带哽咽,但少年也毫不犹豫地说,“我将继续探索围棋的真理。”又是一阵长久的掌声。

  掌声从不仅仅是胜利者独享的奖赏,在竞技体育中,咬紧牙关坦然前行,痛楚和不可能彼此磨砺的坚决与骄傲永远令人心折,更何况,少年与人工智能的搏命而战,也将围棋的历史翻开了全新的一页。

  AlphaGo改变着人类在几百年的时间里,以智慧和经验主义所累积下来的关于围棋的知识。从与李世石对战时,让“棋圣”聂卫平脱帽致敬的五路肩冲,到Master的擅长地“点三三”和“二间高跳”,再到这次人机大战中AlphaGo体现出对厚势和中腹的重视,职业棋手常昊在大盘解说中颇为感慨:“吴清源大师一生只下了800盘棋,他只能靠自己的经验去量化,边角相对容易,中腹则难以量化,但狗可以通过几百万盘自我对弈和强大的计算力做到。”职业棋手古力则表示:“过去被禁锢的想法很多,但现在棋的自由度变得太大了。”

  按照AlphaGo团队的说法,AlphaGo 将在此次比赛后,退出竞技比赛的舞台。但他们将和柯洁一起研究这三盘对局,公开AlphaGo给出的变化图,同时将公布AlphaGo自我对弈的50盘慢棋棋谱,同时将在今年稍晚时候发布最后一篇学术论文,详细介绍在算法效率上所取得的一系列进展。借助他们的研究成果,更多开发者就能够创造出更多强大的围棋人工智能应用。这些“武功秘籍”公诸于世,意味着人工智能与棋手们真正化敌为友,为他们通向围棋技术的至高峰顶,铺出一条前所未有的路。

  至于AlphaGo积累下来的技术,也并不会被浪费,其中的高级通用算法,将被用于降低能源消耗、新材料发明和医疗。有数据显示,基于AlphaGo的算法,互联网公司数据中心的能源消耗可减少40%。

  2016年年初的一天,中国围棋协会主席王汝南拍着李世石的肩膀,跟他说:“你运气好,有人要送给你100万美元。”那时候没有人想到,人类顶尖棋手会输给人工智能哪怕一局棋,那时一切都还没有发生。

  2017年5月27日,王汝南将职业九段证书发给了AlphaGo。

  但此后,未来以加速度呼啸而来。

  围棋与人工智能的故事,正是人类与人工智能相处与相知的某种预示。人们创造人工智能,通过它们更有效率的观察世界,更深入地了解世界运行的法则,并借助它奔向更加广阔的未来。

  柯洁微笑着拥抱了哈萨比斯,

  少年输了,未来赢了。

标签: 柯洁AlphaGo人工智能

相关阅读:

加载中,请稍候...

推荐阅读

加载中,请稍候...