樊麾独家回应：我没放水昏招都被它抓到了

2016年01月29日11:13 四川在线-华西都市报我有话说收藏本文

樊麾0比5不敌谷歌的“阿尔法围棋”

　　5：0 阿尔法棋局一小步人工智能一大步

　　人工智能下围棋到底有多难？

　　计算围棋是个极其复杂的问题，比国际象棋要困难得多。围棋最大有3^361（3的361次方）种局面，大致的体量是10^170，而已经观测到的宇宙中，原子的数量才10^80。国际象棋最大只有2^155种局面，称为香农数，大致是10^47。

　　面对任何棋类，一种直观又偷懒的思路是列举所有能赢的方案，这些方案会形成一个树形地图。电脑只要根据这个地图下棋就能永远胜利。然而，围棋一盘棋以平均要下150步计，每一步有250种可选的下法，所以粗略来说，要是电脑用列举所有情况的方式，围棋需要计算250^150种情况，大致是10^360。相对的，国际象棋每盘大约80步，每一步有35种可选下法，所以只要算35^80种情况，大概是10^124。无论如何，枚举所有情况的方法是不可行的，所以研究者们需要用巧妙的方法来解决问题，他们选择了模仿人类大师的下棋方式，并采用电脑人工智能。

　　据报道，阿尔法围棋最新版具有强大的人工智能功能，它可以通过输入大量高手对局来提高水平。此外，更为强大的是，它可以通过“人机对局”、“机机对局”进行训练来不断提高水平。由于现在计算机的运算能力是极其强大的，因此“阿尔法围棋”水平还会不断进步和提高。

　　川籍职业棋手余平在自媒体中评论本次人机对弈第五局时说，带圈的白子，是“惊天动地”的一手，尽管别的职业高手认为这是步臭棋，但余平认为电脑学会了在放弃蝇头小利，而掌控中腹大势，也就是说可能具备了棋圣聂卫平式的大局观，这才是电脑真正可怕的地方！

　　电脑终将打败人脑，即使是东方人所钟爱的围棋。只是这一天似乎来得太快了，据国际顶尖期刊《自然》1月28日报道：由谷歌开发的一款名叫“阿尔法围棋”（Alphago）的人工智能，在一场秘密试验中，在分先（平下，不让子）状态下5：0击败中国旅欧职业棋手、法国围棋总教练樊麾二段！

　　当天，樊麾二段接受本报记者微信采访时回应：“我输了，这是肯定的，而且没什么机会，大家都看到了。因为此前和谷歌签了保密协议，所以现在也许我不能把所有的东西都告诉大家。有的人说我‘放水’，怎么可能呢？我想赢，而且尽了我的全力，只能说，可能我棋比较臭呗。”

　　“阿尔法”战传奇李世石？

　　还不能说

　　据了解，击败实力不俗的现役欧洲冠军樊麾之后，今年三月，谷歌将安排“阿尔法”挑战韩国籍世界冠军李世石九段，近十年来，李世石是夺取世界冠军头衔次数最多的超一流棋手，所以从严格意义上讲，那才是真正的“人机大战”。

　　作为“阿尔法”的手下败将，樊麾如何预测即将到来的“人机大战”大胜负？对此，樊二段表示：“这个确实属于保密协议中的内容，我只能说不知道。”他还回顾了当时的比赛情景——“就是在一个特定的房间里，我面前有一张棋盘和一台电脑，我没有在电脑上直接下，而是通过棋盘下的。”至于落败的原因，樊麾分析如下——“首先是自己棋有点臭，尤其是到了后半盘，开始读秒的时候老打‘勺子’，下得也比较着急，我这些毛病，事后看都被电脑抓住了。其次应该说是心态问题，我太想赢了，而且一开始我也不太相信它能战胜我。”

　　樊麾棋力如何？据笔者了解，虽然他早已淡出一线，目前依然可称“欧洲围棋之巅”，去年参加世界大赛，也有非常精彩的表现。与一线的职业高手相比，樊总教练自然会有些差距，不过要说一般的业余围棋高手可以撼动他，这绝无可能。从这个意义上讲，“阿尔法”的胜利是颇具含金量的。

　　本土围棋界“电脑专家”：太可怕了！

　　余平六段一晚上睡不着觉，无他，作为当年中国国家围棋队里知名的“电脑高手”，他充分理解电脑在围棋领域战胜职业选手意味着什么。

　　“我知道这一天终归会来，但是没想到来得这么快！以前我预测如果我亲自去搞一个人工智能程序，击败职业棋手的话，可能需要20年，没想到谷歌这么快就完成了。现在的问题是，阿尔法人工智能的核心是神经网络——策略网络和值网络，我个人认为前者最重要。如果是通过深度学习，也就是用人堆出来的神经网络打败了樊麾，我觉得还可以接受，但如果不是用人堆的，而是真正的人工智能，那就太可怕！你想：如果人工智能已经不需要用人去堆，未来世界里，一个机器人的价值已经不能用人数去抗衡，这可能会颠覆人类固有的理念！”

　　至于刚刚结束的“人机大战”，职业六段余平仔细研究了公布出来的棋谱，他总结：“我认为电脑围棋现在真的很厉害，很简单，它布局采取日本式的，非常工稳，到了中盘，电脑具有非常卓越的大局观，和职业棋手相比也不逊色，而到了后半盘官子阶段，算目数对它来说太简单了，还不会失误，这太重要了。我认为将来人类职业棋手如果不能在中盘就打败电脑，一旦进入后半盘，就根本没戏。”

　　余平还预测了三月份即将展开的“阿尔法”与李世石之战——“我感觉，李世石要吃苦头了！” 华西都市报记者贾知若

　　战传奇

　　阿尔法可能隐藏实力

　　李世石迎战：有信心获胜

　　100万美元史上最高围棋赛奖金！3月8日至15日李世石九段将与谷歌围棋AlphaGo在首尔进行人机大战，胜者奖金高达100万美元。据悉谷歌围棋如获胜将捐赠奖金。李世石欣然应战，表示有信心获胜。

　　英国时间27日下午6点，位于伦敦的谷歌旗下人工智能研究机构DeepMind在世界顶级学术杂志《自然》发表了关于围棋人工智能项目的论文，顿时成为业界焦点。阿尔法在堪称人工智能难关中的皇冠——围棋项目中达到了里程碑的成绩，被誉为开创了人工智能的新纪元。谷歌围棋论文中公布了AlphaGo与樊麾的5局棋谱，有韩国棋手品过之后认为AlphaGo棋风很沉着，在局部的次序和战斗与众不同，按棋谱显示的实力，目前最顶尖棋手能让其2至3子。但由于对局是去年10月进行的，谷歌方面或许有意隐藏实力，AlphaGo有可能已达到职业五段水平。

　　谷歌围棋随即向顶级职业棋手李世石发出挑战，比赛预计3月8日至15日在首尔举行，胜者奖金高达100万美元，相关的记者发布会稍后会在“谷歌韩国”举行。

　　欣然应战的李世石表示，很荣幸能与谷歌人工智能围棋对决，感到非常高兴。这是围棋史上的重要比赛，所以接受挑战，并且有信心获胜。

　　看好谁

　　李世石可能比阿尔法强在哪？

　　人类围棋的最高水平比计算机高明在哪？其实就在于一些定式、死活、对杀计算这些“实”之外的一些“虚”的东西。

　　以李世石与朴廷桓名人战决赛第4局的较量为例，李世石在白1托右下角的时候出人意料地选择脱先2位尖，着实令人感到匪夷所思。我们不去评价这手棋是不是棋盘上最佳的一手，这手棋的关键在于很多隐藏的意图。计算机可能会通过棋型判断左边的黑棋会不会有安全问题，如果没有断然不会自补一手，而是思考右下局部如何应对，但李世石为何下这一手呢？1加强了左边黑棋的，2瞄着下边的冲断，3瞄着侵消左边白棋，4瞄着将来或许可以攻击上边的白棋。这几个意图在这一手落下之后便不再神秘，但在落子前这些信息是完全隐藏的。

　　如何发现这些隐藏的信息、意图以及做出选择之前全方位的模糊价值判断，才是计算机攻克这次瓶颈的关键所在。然而，一旦突破之后，恐怕围棋人工智能将不可阻挡。

　　人类发明了汽车，跑得比人快得多。发明了船和潜艇，也比人更能驾驭江河湖海。发明了飞机征服了天空。现在，人类发明的计算机正在展开智能领域的凶悍攻势，围棋或许是人类最后的堡垒。3月AlphaGo与李世石史无前例的人机大战，您看好谁？

　　众说

　　上海围棋队主教练刘世振：“之前的顶级围棋AI棋力基本维持在业余五段的水平。有职业围棋选手参与的人机大战，一般都会让电脑五个子左右。在我看来，今年3月，李世石取胜没有悬念。”

　　《自然》杂志：“人类在下棋时有一个劣势，在长时间比赛后，他们会犯错，但机器不会。而且人类或许一年能玩1000局，但机器一天就能玩100万局。”

　　世界冠军柯洁：“这一次，谷歌悬赏一百万美刀与李世石下，只能说李世石运气太好。以现在这个计算机的实力战胜李世石的可能性不到5%。”

　　脸书CEO扎克伯格：在过去六个月中，我们已开发了一个人工智能系统，代号为Darkforest。它走棋的速度很快，每隔0.1秒就能走一步棋。我们已经快要成功了。

　　揭奥秘

　　“深蓝”之后，人类最后的智力骄傲要洗白？

　　这是人类历史上，围棋AI第一次在公平比赛中战胜职业选手。

　　1997年，国际象棋AI第一次打败顶尖的人类；2006年，人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石，在电脑面前终于一败涂地，应了四十多年前计算机科学家的预言。

　　阿尔法的必杀技：机器学习

　　曾预言

　　计算机围棋赢人类需要10年

　　至少还有东方，人们自我安慰道。围棋AI长期以来举步维艰，顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理：国际象棋中，平均每回合有35种可能，一盘棋可以有80回合；相比之下，围棋每回合有250种可能，一盘棋可以长达150回合。这一巨大的数目，足以令任何蛮力穷举者望而却步——而人类，我们相信，可以凭借某种难以复制的算法跳过蛮力，一眼看到棋盘的本质。

　　英国围棋协会主席乔恩·戴蒙德表示：“这场比赛之前，我曾预计，计算机程序能够击败人类顶级围棋选手，起码要等到5至10年后。”

　　谷歌的研究者们祭出了终极杀器——“深度学习”。深度学习是目前人工智能领域中最热门的科目，它能完成笔迹识别，面部识别，驾驶自动汽车，自然语言处理，识别声音，分析生物信息数据等非常复杂的任务。

　　训练AI

　　自己跟自己下棋棋力更精进

　　人类在下棋时有一个劣势，在长时间比赛后，他们会犯错，但机器不会。而且人类或许一年能玩1000局，但机器一天就能玩100万局。所以阿尔法只要经过了足够的训练，就能击败所有的人类选手。

　　研究者们用许多专业棋局训练AI，这种方法称为监督学习，然后让AI和自己对弈，这种方法称为强化学习，每次对弈都能让AI棋力精进。然后他就能战胜冠军啦！阿尔法的核心是两种不同的深度神经网络。“策略网络”和“值网络”。它们的任务在于合作“挑选”出那些比较有前途的棋步，抛弃明显的差棋，从而将计算量控制在计算机可以完成的范围里，本质上和人类棋手所做的一样。

　　真优势

　　推算20步内哪里下子赢面大

　　“值网络”负责减少搜索的深度——AI会一边推算一边判断局面，局面明显劣势的时候，就直接抛弃某些路线，不用一条道算到黑；而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋，有些棋步是明显不该走的，比如不该随便送子给别人吃。利用蒙特卡洛拟合，将这些信息放入一个概率函数，AI就不用给每一步以同样的重视程度，而可以重点分析那些有戏的棋着。阿尔法利用这两个工具来分析局面，判断每种下子策略的优劣，就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下，就能判断在哪里下子赢的概率会高。

　　本组稿件综合新华社、央视、《参考消息》等

文章关键词：围棋李世石樊麾人工智能

点击下载【新浪体育客户端】，赛事视频直播尽在掌握

欢迎发表评论

分享到: