田渊栋出席喆理沙龙 脸书人工智能围棋或将开源

2016年03月27日11:44    新浪体育 微博 收藏本文
Facebook田渊栋Facebook田渊栋

  新浪体育讯  3月26日8:30清华大学新斋,喆理围棋沙龙举行第四期:人机大战。过去的半个月里,AlphaGo与李世石的人机大战无疑是最吸引眼球的事件。喆理沙龙在这段时间也连续发表了多篇文章,结合AI算法和围棋技术对比赛进行了详细的分析。如今,赛事已告一段落,各式各样的争论也逐渐偃旗息鼓,我们不妨静下来,重新审视过去的几盘棋,想一想人工智能未来在棋界的发展,思考AlphaGo带来的启发。

  与以往一样,本期沙龙也有几位重量级嘉宾坐镇,包括:田渊栋,卡耐基梅隆大学机器人系博士,Facebook围棋AI“黑暗森林”负责人;李喆六段,喆理围棋发起者;刘知青,北京邮电大学教授,北邮九鼎围棋研究所所长;中国棋院围棋部部长王谊;新浪高级战略副总裁褚达晨;围棋部邵炜刚九段;围棋TV创始人刘星七段、赵守洵五段;万同围棋CEO陈雷;葛玉宏;谢骏;安淑卿;张晓茵;刘元博;鲍橒;由小川;全龙;李磊;章云轩等。

  中国棋院围棋部部长王谊首先发言:30年前聂卫平老师在中日擂台赛掀起围棋旋风,30年后人机大战再掀热潮,希望大家彼此借鉴、相互支持,把围棋推向另一个高峰。李喆在围棋领域成就不用说,现在北大就读一点都不输于全国高材生,同堂学业不落下风,在京华杯与古力大战两回合1比1,在围棋和学业双丰收,棋手在各个领域都能有发展,围棋协会也很欣慰。AlphaGo获胜后,各地很多棋界人士说对李世石不公平,对人机大战具体细节也不够理解。今天很荣幸能来参加会议,正好向各位专家学习,回去好给各方答疑。

  随后田渊栋博士以问答形式进行交流。刚刚在日本举行的UEC杯电脑围棋大赛中,脸书“黑暗森林”人工智能荣获亚军。受让三子对阵小林光一老师时,在有4目左右优势的情况下田博士选择了投子。田博士介绍说黑暗森林相当于AlphaGo的早期版本,在走子网络方面数值要高于谷歌,不过在重要的价值评估网络方面,还是谷歌更优秀,所以我们还有很长的路要走。据大卫席尔瓦透露,根据内部对弈测试的等级分,AlphaGo最新版让半年前胜樊麾的版本4子互有胜负,等级分估值已达4500分,所以他们此前已非常有信心战胜李世石。

  估值网络是通过自我对局来训练,为防止过拟合,每一局只取一个局面,这样需要大量数据,可能为了需要非常快的对局速度,棋局质量就会下降。不用蒙特卡洛搜索树,只是用走子网络来快速对局,一两分钟就可下完一盘。谷歌说积累了3千万盘,根据这样的速度,再乘以10倍也是没问题的。人机大战第四局AlphaGo出现失误,或许也和快速走子网络有关。理论上可以填补电脑计算上的漏洞,但用时会大幅增加。所以在目前这样框架下的电脑系统,大局观非常强,但局部作战计算就相对差一点。而且电脑可能会在开局时觉得局部亏了也无所谓。

  由于架构不同,所需的计算资源也会不同。AlphaGo单机版已经很强,但如果增加计算资源,也会变得更强。如面对第四局78挖一手,脸书内部测试是排序在第31位的选点,而古力推荐的靠是第10位选点。AlphaGo那几手用时和其他步数一样,可能设计的价值网络权重出了问题。如果由人来控制,可以发挥的更好。夫人是国际象棋世界冠军,介绍过国象有人与电脑一起参加的棋赛,可能效果会更好。

  第四局的胜负处,黑暗森林也一直判断黑方胜率很高,然后突然就掉下来了,有可能是价值网络在那个局部估值不对。另外关于用时,AlphaGo有另外的模型来控制用时,是动态的。

  对于黑暗森林,可能会特别在意打劫,也会不注意劫的大小,每步都要考虑劫的分支。对于人来说,看到无关紧要的劫就会忽略,但黑暗森林还不会。人比电脑聪明,程序只是勤能补拙,通过大量计算来弥补。

  人工智能是通过多次模拟来得出胜率,对于每个局面来进行评估,估值、搜索加上走子网络相结合。黑暗森林在不使用任何搜索的条件下,在KGS对弈网很容易达到3d棋力。

  如果人机对弈双方用时都加长,对电脑会更有利,棋手长考多了效率会降低,电脑则时间越多越强。人如果组团出战,胜负关键还是在于能否击中AlphaGo的弱点。

  邵炜刚:国家队也有过加压棋,对聂老、马老也用过类似方法。比如针对李昌镐巅峰时期,很多高手一起研究也会强于单人,但多人在一起研究需要一个核心才行。这需要达成一个共识,单人作战不行,只有团队上才行的时候。

  田渊栋:AlphaGo的结构在论文里都公布了,大方向、路线已确定,所以只要投入够,理论上都能实现AlphaGo的水平。我们做的“黑暗森林”可能会在训练得更强之后选择开源。

  褚达晨:假如围棋之神是100,AlphaGo是模拟人类,在达到30/40后,也有可能会遇到瓶颈升不上去。

  鲍橒:由于没有参考19路以外棋盘的棋谱,所以脸书、AlphaGo都只在19路盘下棋,如果在29路棋盘下棋,发挥就不会很好,因为没有之前的基础数据。

  赵守洵:如果两个相似分支判断的胜率相近,每次选点结果是否也可能不同,存在随机性。

  喆理围棋沙龙由李喆六段发起,清华围棋文化交流与研究基金主办。旨在以沙龙的形式,吸引志同道合的朋友,从文化、哲学等方面出发,共同思考、交流意见,探寻围棋的价值与本质。

  希望参与讨论、投稿或参与沙龙延展项目请发邮件至zlweiqi@sina.com,期待您的参与!

文章关键词:人工智能围棋人机大战

点击下载【新浪体育客户端】,赛事视频直播尽在掌握
分享到:
收藏  |  保存  |  打印  |  关闭

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0
收藏成功 查看我的收藏
0 0 0 0