新闻晨报:人类可以被击败 但围棋依然在那里

2016年02月01日17:08    新闻晨报 收藏本文
谷歌围棋挑战人类谷歌围棋挑战人类

  上周出了大新闻。

  “谷歌的计算机围棋程序与欧洲围棋冠军、职业二段樊麾下了5盘19路分先对局,计算机5:0战胜樊麾,并且今年三月会与李世石对决。这个成绩加上棋谱分析表明计算机围棋程序已完全接近职业棋手水平。计算机围棋程序主要使用了神经网络的方法,具体的细节还有待于阅读论文。”1月28日早晨,人工智能专家刘知青教授发来这封电邮。

  消息已经在网络上引起了围棋爱好者的一些热议,大多数棋手和爱好者不认为变化马上就会到来。在他们眼里,围棋代表了东方智慧,是唯一不能被机器打败的。打败了围棋,就是打败了人类……

  我们,刘教授和我,辛苦一年多的《对面千里——人工智能和人的围棋谈话》正在上海文化出版社三审。我们的书要想表达高科技时代人们对于围棋的认识,似乎就是为这个新闻而写。书的最后一章《未来》,就是预想一旦计算机围棋战胜了人类的最好棋手,人们会作何感想,围棋会如何生存。

  我们也曾思考过是不是要对这本书做一些修改。刘知青教授再次发来电邮,他确信:“好在我们基本的观点仍然不受影响,唯一有疑问的是我们关于战胜人类的时间预测过于保守了。”

  在我们的书中,刘教授预计未来5至10年,计算机将会战胜人类最好的棋手,可称作“围棋界的卡斯帕罗夫”。樊麾二段虽然还不能称为“最好的棋手”,不过 他迈过了“专业门槛”,去年10月,计算机战胜了他,就是一个非常巨大的突破。刘教授相信,很快将会有接二连三的专业棋手被计算机战胜。

  学习方法

  “新闻”刚刚过去24小时,刘教授深夜的电邮,对这一比赛作了技术上的分析:

  谷歌的计算机围棋程序叫作AlphaGo,引入了深度神经网络(Deep Neural Networks)的新方法,来改善盘面评估和落子选择。

  负责盘面评估的神经网络叫做价值网络; 负责落子选择的神经网络叫做策略网络。这两种神经网络都是通过机器学习方法来训练获得的。

  策略网络的训练是通过使用职业棋手的棋谱进行有监督的机器学习; 价值网络的训练是通过自己与自己的对弈,根据胜负的结果进行无监督的增强性学习。

  不加任何搜索,谷歌的深度神经网络已能够达到现有蒙特卡罗树搜索方法所能达到的最高围棋对弈水平。在两种深度神经网络之上,谷歌又引入了一种新的搜索算 法,把蒙特卡罗评估与价值网络和策略网络结合在一起。可以看到,谷歌以把计算机围棋技术提升到了“专家系统”和“蒙特卡洛评估”之后的第三个阶段:“基于 深度神经网络的机器学习”。

  这些机器学习的方法与人类的学习方法是完全一致的。在这个意义上,我们目前很难估计这些方法的瓶颈是什么。

  经验的价值

  请注意刘知青教授这样分析:“这些机器学习的方法与人类的学习方法是完全一致的。”而“很难估计瓶颈”,说明AlphaGo的这些方法还有很大的空间。

  在棋盘面前,机器和人在学习什么?我们在书中,引用中国科技大学和美国明尼苏达大学神经认知科学家在实验报告中的一段话:

  中美两国研究者另一引人注目的实验发现是:下国际象棋和围棋时,都没有用到之前科学家认为的与通用智力关系密切的脑区——前额叶。对于这一违反“常识”的发现,美国斯坦福大学的一位教授认为,这可能是因为多数被认为反映“聪明”的智能活动,其实主要是基于经验。

  在书中,我们没有展开探讨。“经验”在哲学上有其特别的意义,没有深度领会哲学家的思考,不敢贸然说话。当谷歌在和专业棋手对弈中获得巨大突破时,使我 们不得不仓促写下感想。如果斯坦福大学那位科学家的推测成立,那么,他所说的,不会仅仅是棋手个人对局的体会。我们可以将围棋看成是一个非常有象征性的经 验样本,数千年围棋史写满了经验,有着人类智慧的意义。这些经验已经越出了棋界,成为社会的精神财富。

  曾经询问过参加工作的科学家,得知参加实验的,大多数都是业余棋手。这一实验,可能没有包括创造力特别强大的棋手,不过,这没有关系。当围棋经验被计算 机看作是一个巨大数据库的时候,任何大棋士的创造,只能是无边森林中的一棵树。在网络时代,棋谱已经迅速公开,几乎所有的对弈技术,一经在比赛中出现,都 可以很快成为共同的经验。个人经验发挥作用的时间越来越短促。

  棋手和计算机都用围棋经验下棋,谁学得好,谁就能赢。如果说,人在对弈时必须要学习的是围棋技术那一部分的经验,那么机器学到的、处理的也是这些经验。而在学习的速度和质量上,AlphaGo具有非常大的优势。

  研究终点不仅是赢棋

  刘教授的注意力,聚焦在Al-phaGo的“学习能力”上,这是必然的。

  这次突破可能最重要的影响,就是让我们更清晰的认知了基于机器学习的神经网络的能力,这种能力应该远远超出我们早期的预想。

  这种能力将在不久的将来,应用在我们生活的方方面面,可以改变我们生活的方式和质量。

  那些聚在谷歌旗帜下的人工智能科学家,绝不是在搞一件网络游戏。他们并不将战胜专业棋手当作研究的终点。刘教授就说过,如果仅仅为了战胜专业棋手,那么全世界无须有那么多人,花费那么多的精力来研究围棋。

  果然,有报道说,谷歌希望AlphaGo能够运用这些技术解决现实社会最严峻、最紧迫的问题,从气候建模到复杂的灾难分析。

  AlphaGo研究者哈萨比斯说:“尽管游戏是快速和高效率开发和检验人工智能算法的完美平台,但最终我们希望把这些方法应用于现实世界的重要问题上。”

  正因为科学家的目的不在击败棋手,而是从围棋经验获得借鉴;因此,面对围棋经验,计算机仅仅取其所需。人机对弈是科学家验证人工智能算法的平台,樊麾二 段和李世石九段,是计算机能力的标尺。即使计算机击败了所有九段棋手,那只证明了“单个的人”赶不上计算机学习和掌握经验的能力。

  在书中,我们讨论计算机能不能“道法自然”的时候,刘教授说:由于数学模型的客观性,它没有人的感情,棋手对于棋子的感情。它只有计算机的理性,所以它在某种程度上面更接近胜负师,它还是把胜负看得最重要,胜负之外它没有任何“感情的牵挂”。  

  围棋永远是围棋

  计算机能够解读的围棋经验,虽然数量极大,但都在胜负范围之内,和胜负无关的,计算机目前还不会学习和处理。可以说,机器不过是在比较局部有限地使用围棋的经验而已。

  围棋经验存在于人类围绕围棋的活动之中,人创造和积累了围棋经验,全面并深入理解围棋经验的,也只有人。机器对于围棋经验的整体,不可能取否认的态度。 围棋依旧在那里,表达人类智慧高度的围棋经验依旧在那里。围棋继续可以担任人类智慧的试金石,在很多棋手心目中存在的“围棋上帝”,可以看作是围棋经验的 总和,仍旧可以令无数人,包括计算机科学家顶礼膜拜。

  围棋巨大的空间依旧存在。或许棋手今后会将注意力更加集注于对弈中发现的崭新形状,获得崭新的体验和经验。当然,这也包括计算机对弈中“一不留神”下出的妙手。计算机的学习,在一定程度上跳过了棋理,只有专业棋手才知道这棋妙在何处。

  围棋经验应该是全方位的经验。陈祖德先生早就说过,胜负对于棋手非常重要,可是围棋并不仅仅是胜负,胜负以外的东西更多。我们将下棋当作生活,从生命或 者生活的意义上去理解棋手,理解对局,那么经验的天地更大。例如围棋经验的棋理部分,虽然大多数离不开棋盘,不过经过了棋手和文人的语言化,便具有中国学 问的特点,它在生活中产生,形成的过程,不是依靠概念推演,而是离不开具体形象,和具体对局。棋理最后成为思想,在社会上传播。在哲学上或者生活上,都有 重要的意义。

  人的一生,都在读一部叫做生活的大书。学会围棋,知道有围棋经验的存在,就等于找到了一本生活辞典,遇上疑难,在棋盘上或许可以找到注解。

  我们想要对每一个爱好者或者棋手说,安心继续下围棋吧,计算机和顶尖棋手的较量无论谁赢,都不会改变你在棋盘边上获得的快乐,围棋依旧值得成为你终生的爱好。

    (注:文中楷体字为刘教授邮件引用)

      (作者简介:著名围棋记者、作家,著有《黑白之道》《黑白之境》和《名局》等围棋著作)

文章关键词:围棋人工智能谷歌围棋

点击下载【新浪体育客户端】,赛事视频直播尽在掌握
分享到:
收藏  |  保存  |  打印  |  关闭

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0
收藏成功 查看我的收藏
0 0 0 0