绝艺练成记:从虎虎有生气到“绝艺”
文章来源:腾讯科技微信公众号
为了参加第十届UEC比赛,未满周岁的绝艺第一次出了国。
UEC杯是世界权威的围棋大赛,每年在日本举行,与普通围棋赛不同,参赛选手不是人类,全是AI。
身为参赛队员之一的绝艺由腾讯AI Lab研发,打造这款围棋AI出来的团队,由13位年轻人组成。
年轻是绝艺以及绝艺团队的一个显著特征。
将绝艺与千里之外的日本UEC比赛现场连接起来只需一台电脑,通过笔记本电脑将绝艺接入对战系统,绝艺就能在围棋机器人的世界里与各方来宾一较高下了。
今年第10届大赛共有30支软件参赛。继18日的循环积分赛中,“绝艺“以七局全胜战绩进入16强后,在今天决赛又以四连胜战绩夺得本届UEC杯冠军,日本“DeepZenGo”获亚军。3月26日,“绝艺”还将在东京与日本先锋棋手一力辽在“电圣战”中进行人机对弈。
对大部分人而言,绝艺是一个显得有些陌生的名字,这源于它从诞生到成长一直保持的低调状态。
尽管在它展露头角的野狐围棋对战平台上,绝艺的成长速度已经被外界注意到;而在UEC上取得优异成果获得更多关注后,绝艺及其背后的团队依然神秘,为此我们对绝艺团队进行了专访,以期还原绝艺的成长路。
从虎虎有生气到“绝艺”
绝艺英文名FineArt,名出唐朝诗人杜牧的《重送绝句》——绝艺如君天下少,闲人似我世间无。别后竹窗风雪夜,一灯明暗覆吴图。颇具中国风的名字,契合围棋起源于中国的历史。
一年前,绝艺还只是一个存在于团队头脑中的想法。
2016年1月28日,腾讯AI Lab高级总监、专家工程师刘永升在内部IM上收到一条来自腾讯副总裁姚星的消息:有没有信心做围棋AI,如果围棋不行,先做象棋AI也行。
姚星之所以萌生做围棋AI的想法,源于他认为做这个对锻炼团队的研发能力有帮助,而且跟腾讯相关的应用前景很大。
彼时刘永升对围棋AI还没有太清晰的概念,于是答复姚星好好调研。在当年春节假期,刘永升找了一些围棋的书籍、论文阅读,对围棋AI有了基本了解。春节回来后,2月17日,姚星问围棋AI有没有在做,刘回答:还在调研,并承诺一个月后出DEMO。
2016年3月4日,第一个DEMO完成,棋力在业余5级左右,到3月下旬,围棋AI正式立项,项目名称weigo,团队也随之搭建起来。
到2016年6月下旬,绝艺棋力突破业务6段,意即突破业余高手水平,这是绝艺的一个重要发展节点。
2016年8月,绝艺以“虎虎有生气”的ID首次在野狐平台(腾讯旗下围棋对弈平台)下棋,8月23日首次战胜职业棋手,9月4日,绝艺以“野狐扫地僧”ID连赢 ID为tby的网友8局,tby是聂卫平长子孔令文的账号。
在不断的学习中,绝艺的能力不断增强。
11月1日,绝艺正式以“绝艺”ID亮相野狐,11月2日第一次战胜世界冠军江维杰(野狐ID若水云寒)。
11月19日晚,“绝艺”首次和柯洁交手,一胜一负;11月28日,“绝艺”对韩国第一人朴廷桓5胜1负。2017年2月14日以后,绝艺对野狐帽子(世界冠军和全国冠军)的胜率,已经能够稳定在90%以上。
这个数据意味着,绝艺长大了。
绝艺是这样“炼成”的
人工智能究竟是如何学习怎样下围棋的?回顾绝艺从0到1的过程能够得到解答。
据绝艺团队介绍,绝艺的学习方式包含两部分,一部分来自人类棋谱,通过深度卷积网络的训练,得到一个策略网络;第二部分为自对弈棋谱,也通过深度卷积网络训练,得到一个估值网络。
怎样把人类的棋谱“喂”给绝艺,而绝艺又是如何理解人类棋谱的?首先绝艺团队会把人类过往棋谱转化为若干二维矩阵,作为深度卷积网络的输入,输出成果是一个 策略网络。策略网络的作用在于,当你再输入一个从来没有存在过的新棋局时,策略网络可以返回若干候选点,并且为每个候选点计算相应的概率值。
在绝艺的成长过程中,与人类棋手对弈是绝艺强大起来的重要原因,绝艺的突破性进展总是伴随其战胜某一实力水平的棋手出现。
“我们在6月底战胜业余强豪,8月初首次战胜职业初级选手,9月首次战胜职业普通选手,11月首次战胜职业高级选手。”
在11月份输给炼心(时越)之后,绝艺闭关了一段时间,主要是大幅度提升了价值网络的精度,随后以刑天的ID再次亮相。
在绝艺团队看来,与人类棋手对弈的意义在于,在研发过程中,如何评估棋力以及存在哪些问题是非常困难的,并且随着绝艺棋力提升,普通的棋手基本无法战胜的时候更难暴露其不足。所以,绝艺的研发过程中得益于世界超一流棋手的指导,非常难能可贵,对研发进度有非常大的帮助。
尽管身为绝艺的研发人员,在开发绝艺的过程中,团队成员依然对AI的强大感到惊喜。
“我们从来没有想象AI可以这么强,很多很复杂的棋,真不知道它为什么可以正确应对,只能说深度神经网络真的很神奇。”
在不断的学习中,绝艺的棋力已经成长到足够让一流棋手另眼相看的程度。2016年11月19日晚上,绝艺和柯洁下了两局,第一局绝艺第一次战胜围棋第一人柯洁,第二局惜败。下完,柯洁发了一个朋友圈,内容是:“下的全是汗…\冷汗”。
团队爱把绝艺比作一个可爱的小孩。
在3月17日绝艺与crazystone的对弈中,下到19手时,团队成员看了绝艺的表现忍不住评价:绝艺又要动粗,要直接一本(柔道术语,意思是直接结束战斗)。
“这就是绝艺可爱的地方,明明很强,偏偏要跟个孩子似的,爱用蛮力。”
推动人类对围棋的认知
AI在围棋上的成就已经得到普遍认可,但围棋AI的存在并不意味着会成为人类棋手终结者。
绝艺团队认为,绝艺是带动人类认识围棋的新力量,它与其他AI不是竞争对手,而是共同推动人类对围棋的认知。
事实上,围棋AI确实能给人类棋手带来一些新角度的启发。
在一手打造了绝艺的团队成员看来,经过多次人机对弈后,他们发现,人类棋手与围棋AI各有特点:“人类比较狡猾,但人类容易犯错;机器比较老实,但几乎不犯错。”
同时,绝艺的大局观,以及对一些定式的变换是能够给人类棋手不少启发的。
而开发围棋AI的意义并不局限于围棋领域。
从团队角度看来,研发绝艺促使团队过去几年在AI算法研究、大规模计算平台以及工程能力得到一次检阅,并对深度学习和强化学习等AI热门研究领域有了很多有价值的探索与创新。
从技术角度看,绝艺背后的人工智能技术是“精准决策”的能力,有非常广阔的应用场景,如无人驾驶、量化金融、辅助医疗等。
对绝艺团队而言,绝艺当前取得的成果一方面完善了腾讯AI基础设施,锻炼了团队,也大大提升了技术视野,强化了团队的信心。另一方面,绝艺给了他们向更广阔AI领域积极进军的信心,随着团队对AI的研究不断深入,AI在其他领域的更多可能将被逐渐挖掘。
事实上,绝艺只是腾讯人工智能战略的一个体现。
2016年4月,腾讯成立AI Lab(腾讯人工智能实验室),致力于人工智能基础科学的开放研究,以及应用领域的深入探索,做到“学术有影响,工业有产出”。
实验室的愿景是打造腾讯全面AI竞争力,让人工智能未来无处不在(Make AI Everywhere)。
目前实验室有50余位世界知名学院的AI科学家(90%为博士)、及200多位经验丰富的工程师进行基础研究与应用探索。
AI Lab聚焦四大领域的基础研究,包括:计算机视觉、语音识别、自然语言处理与机器学习,力求全面覆盖并深层次拓展AI的前沿技术能力。同时发展AI在具有腾讯特色的四大业务场景中的应用能力:内容 AI、社交AI、游戏AI和平台工具AI。
目前产品已应用在上百个腾讯产品上,在绝艺之后,腾讯于AI领域的布局、研究和应用,已经进入加速时代。