樊麾独家回应:我没放水 昏招都被它抓到了

樊麾0比5不敌谷歌的“阿尔法围棋”樊麾0比5不敌谷歌的“阿尔法围棋”

  5:0 阿尔法棋局一小步 人工智能一大步

  人工智能下围棋到底有多难?

  计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3^361(3的361次方)种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。国际象棋最大只有2^155种局面,称为香农数,大致是10^47。

  面对任何棋类,一种直观又偷懒的思路是列举所有能赢的方案,这些方案会形成一个树形地图。电脑只要根据这个地图下棋就能永远胜利。然而,围棋一盘棋以平均要下150步计,每一步有250种可选的下法,所以粗略来说,要是电脑用列举所有情况的方式,围棋需要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,大概是10^124。无论如何,枚举所有情况的方法是不可行的,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式,并采用电脑人工智能。

  据报道,阿尔法围棋最新版具有强大的人工智能功能,它可以通过输入大量高手对局来提高水平。此外,更为强大的是,它可以通过“人机对局”、“机机对局”进行训练来不断提高水平。由于现在计算机的运算能力是极其强大的,因此“阿尔法围棋”水平还会不断进步和提高。

  川籍职业棋手余平在自媒体中评论本次人机对弈第五局时说,带圈的白子,是“惊天动地”的一手,尽管别的职业高手认为这是步臭棋,但余平认为电脑学会了在放弃蝇头小利,而掌控中腹大势,也就是说可能具备了棋圣聂卫平式的大局观,这才是电脑真正可怕的地方!

  电脑终将打败人脑,即使是东方人所钟爱的围棋。只是这一天似乎来得太快了,据国际顶尖期刊《自然》1月28日报道:由谷歌开发的一款名叫“阿尔法围棋”(Alphago)的人工智能,在一场秘密试验中,在分先(平下,不让子)状态下5:0击败中国旅欧职业棋手、法国围棋总教练樊麾二段!

  当天,樊麾二段接受本报记者微信采访时回应:“我输了,这是肯定的,而且没什么机会,大家都看到了。因为此前和谷歌签了保密协议,所以现在也许我不能把所有的东西都告诉大家。有的人说我‘放水’,怎么可能呢?我想赢,而且尽了我的全力,只能说,可能我棋比较臭呗。”

  “阿尔法”战传奇李世石?

  还不能说

  据了解,击败实力不俗的现役欧洲冠军樊麾之后,今年三月,谷歌将安排“阿尔法”挑战韩国籍世界冠军李世石九段,近十年来,李世石是夺取世界冠军头衔次数最多的超一流棋手,所以从严格意义上讲,那才是真正的“人机大战”。

  作为“阿尔法”的手下败将,樊麾如何预测即将到来的“人机大战”大胜负?对此,樊二段表示:“这个确实属于保密协议中的内容,我只能说不知道。”他还回顾了当时的比赛情景——“就是在一个特定的房间里,我面前有一张棋盘和一台电脑,我没有在电脑上直接下,而是通过棋盘下的。”至于落败的原因,樊麾分析如下——“首先是自己棋有点臭,尤其是到了后半盘,开始读秒的时候老打‘勺子’,下得也比较着急,我这些毛病,事后看都被电脑抓住了。其次应该说是心态问题,我太想赢了,而且一开始我也不太相信它能战胜我。”

  樊麾棋力如何?据笔者了解,虽然他早已淡出一线,目前依然可称“欧洲围棋之巅”,去年参加世界大赛,也有非常精彩的表现。与一线的职业高手相比,樊总教练自然会有些差距,不过要说一般的业余围棋高手可以撼动他,这绝无可能。从这个意义上讲,“阿尔法”的胜利是颇具含金量的。

  本土围棋界“电脑专家”:太可怕了!

  余平六段一晚上睡不着觉,无他,作为当年中国国家围棋队里知名的“电脑高手”,他充分理解电脑在围棋领域战胜职业选手意味着什么。

  “我知道这一天终归会来,但是没想到来得这么快!以前我预测如果我亲自去搞一个人工智能程序,击败职业棋手的话,可能需要20年,没想到谷歌这么快就完成了。现在的问题是,阿尔法人工智能的核心是神经网络——策略网络和值网络,我个人认为前者最重要。如果是通过深度学习,也就是用人堆出来的神经网络打败了樊麾,我觉得还可以接受,但如果不是用人堆的,而是真正的人工智能,那就太可怕!你想:如果人工智能已经不需要用人去堆,未来世界里,一个机器人的价值已经不能用人数去抗衡,这可能会颠覆人类固有的理念!”

  至于刚刚结束的“人机大战”,职业六段余平仔细研究了公布出来的棋谱,他总结:“我认为电脑围棋现在真的很厉害,很简单,它布局采取日本式的,非常工稳,到了中盘,电脑具有非常卓越的大局观,和职业棋手相比也不逊色,而到了后半盘官子阶段,算目数对它来说太简单了,还不会失误,这太重要了。我认为将来人类职业棋手如果不能在中盘就打败电脑,一旦进入后半盘,就根本没戏。”

  余平还预测了三月份即将展开的“阿尔法”与李世石之战——“我感觉,李世石要吃苦头了!” 华西都市报记者贾知若

  战传奇

  阿尔法可能隐藏实力

  李世石迎战:有信心获胜

  100万美元史上最高围棋赛奖金!3月8日至15日李世石九段将与谷歌围棋AlphaGo在首尔进行人机大战,胜者奖金高达100万美元。据悉谷歌围棋如获胜将捐赠奖金。李世石欣然应战,表示有信心获胜。

  英国时间27日下午6点,位于伦敦的谷歌旗下人工智能研究机构DeepMind在世界顶级学术杂志《自然》发表了关于围棋人工智能项目的论文,顿时成为业界焦点。阿尔法在堪称人工智能难关中的皇冠——围棋项目中达到了里程碑的成绩,被誉为开创了人工智能的新纪元。谷歌围棋论文中公布了AlphaGo与樊麾的5局棋谱,有韩国棋手品过之后认为AlphaGo棋风很沉着,在局部的次序和战斗与众不同,按棋谱显示的实力,目前最顶尖棋手能让其2至3子。但由于对局是去年10月进行的,谷歌方面或许有意隐藏实力,AlphaGo有可能已达到职业五段水平。

  谷歌围棋随即向顶级职业棋手李世石发出挑战,比赛预计3月8日至15日在首尔举行,胜者奖金高达100万美元,相关的记者发布会稍后会在“谷歌韩国”举行。

  欣然应战的李世石表示,很荣幸能与谷歌人工智能围棋对决,感到非常高兴。这是围棋史上的重要比赛,所以接受挑战,并且有信心获胜。

  看好谁

  李世石可能比阿尔法强在哪?

  人类围棋的最高水平比计算机高明在哪?其实就在于一些定式、死活、对杀计算这些“实”之外的一些“虚”的东西。

  以李世石与朴廷桓名人战决赛第4局的较量为例,李世石在白1托右下角的时候出人意料地选择脱先2位尖,着实令人感到匪夷所思。我们不去评价这手棋是不是棋盘上最佳的一手,这手棋的关键在于很多隐藏的意图。计算机可能会通过棋型判断左边的黑棋会不会有安全问题,如果没有断然不会自补一手,而是思考右下局部如何应对,但李世石为何下这一手呢?1加强了左边黑棋的,2瞄着下边的冲断,3瞄着侵消左边白棋,4瞄着将来或许可以攻击上边的白棋。这几个意图在这一手落下之后便不再神秘,但在落子前这些信息是完全隐藏的。

  如何发现这些隐藏的信息、意图以及做出选择之前全方位的模糊价值判断,才是计算机攻克这次瓶颈的关键所在。然而,一旦突破之后,恐怕围棋人工智能将不可阻挡。

  人类发明了汽车,跑得比人快得多。发明了船和潜艇,也比人更能驾驭江河湖海。发明了飞机征服了天空。现在,人类发明的计算机正在展开智能领域的凶悍攻势,围棋或许是人类最后的堡垒。3月AlphaGo与李世石史无前例的人机大战,您看好谁?

  众说

  上海围棋队主教练刘世振:“之前的顶级围棋AI棋力基本维持在业余五段的水平。有职业围棋选手参与的人机大战,一般都会让电脑五个子左右。在我看来,今年3月,李世石取胜没有悬念。”

  《自然》杂志:“人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。”

  世界冠军柯洁:“这一次,谷歌悬赏一百万美刀与李世石下,只能说李世石运气太好。以现在这个计算机的实力战胜李世石的可能性不到5%。”

  脸书CEO扎克伯格:在过去六个月中,我们已开发了一个人工智能系统,代号为Darkforest。它走棋的速度很快,每隔0.1秒就能走一步棋。我们已经快要成功了。

  揭奥秘

  “深蓝”之后,人类最后的智力骄傲要洗白?

  这是人类历史上,围棋AI第一次在公平比赛中战胜职业选手。

  1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。

  阿尔法的必杀技:机器学习

  曾预言

  计算机围棋赢人类需要10年

  至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。

  英国围棋协会主席乔恩·戴蒙德表示:“这场比赛之前,我曾预计,计算机程序能够击败人类顶级围棋选手,起码要等到5至10年后。”

  谷歌的研究者们祭出了终极杀器——“深度学习”。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。

  训练AI

  自己跟自己下棋棋力更精进

  人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以阿尔法只要经过了足够的训练,就能击败所有的人类选手。

  研究者们用许多专业棋局训练AI,这种方法称为监督学习,然后让AI和自己对弈,这种方法称为强化学习,每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!阿尔法的核心是两种不同的深度神经网络。“策略网络”和“值网络”。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

  真优势

  推算20步内哪里下子赢面大

  “值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。阿尔法利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

  本组稿件综合新华社、央视、《参考消息》等

文章关键词:围棋李世石樊麾人工智能

点击下载【新浪体育客户端】,赛事视频直播尽在掌握
分享到:
收藏  |  保存  |  打印  |  关闭

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0
收藏成功 查看我的收藏
0 0 0 0