黄士杰揭阿尔法获胜关键 判断优势及最佳棋路

2016年03月18日17:35    新浪体育 微博 收藏本文
黄士杰代替阿尔法出战黄士杰代替阿尔法出战

  文/记者谭伟晟

  据自由日报消息,作为人工智能开发的新里程碑,Google旗下DeepMind团队所开发的AlphaGo系统,在最近一场与世界棋王顶尖对决中,最终以4比1拿下胜利,并且荣登世界棋士排行榜第二名的位置。这场让世人见证到人工智能的高速发展的赛事,也让幕后开发AlphaGo的DeepMind团队立时成为受瞩目对象。其中来自台湾的DeepMind成员、同时也是代AlphaGo在棋盘上落子的黄士杰,今天亲临Google台湾,要来分享AlphaGo的致胜关键!

  来自台湾的黄士杰,目前是Google旗下DeepMind团队的资深研究员,也是AlphaGo人工智能系统的重要开发者。而能够成为AlphaGo的关键人物。曾经开发过围棋人工智能、做过围棋老师的他,认为围棋是相当适合AI人工智能的挑战,特别是在深蓝在1997年击败人类后,围棋成为AI人工智能仍未取胜的领域。

  其中AlphaGo之所以能获胜,最主要的原因在于可以‘判断优势’、‘以及取得最佳的棋路’两大要素,透过学习人类千年来智慧的结晶,学习大量的棋谱与棋路,因此可以拥有类似人类的‘直觉’下法,无须穷举运算所有的棋路,就可以决定哪一个落子处,最有机会获的胜利。

  其中黄士杰表示,‘直觉’是围棋比赛中最重要的关键,职业棋士总会有神来一着,但他们也无从说起判断为何。黄士杰指出,这就是‘直觉’的重要性,透过优先找出更有优势、胜率更高的棋路,让计算机不必穷尽所有棋路可能,而可以选择最有胜率的20步,以采取胜率最高的策略。

  黄士杰提到,由于围棋的变化有10的170次方,若是想要把所有的棋路穷尽思量,那么几亿年也无法运算完。因此AlphaGo采取可以判断优势的‘策略网络’,辅以可以推断棋路的‘价值网络’,让AlphaGo能拥有类似人类的直觉,以便在围棋这类复杂的棋类运动中,与人类对弈、进一步取得胜利!

  黄士杰表示,在1990年时,人工智能还无法做到与人类较量围棋的能力,当时尽管让AI先下25个棋子,但仍会在最后全部被吃光落败。时至今日透过Google机器学习技术的帮助,AI的发展已经突飞猛进,在这次与李世石的对弈中,甚至获得5战4胜的成绩。

  不过回顾比赛当时、坐在李世石对面的黄士杰,其实是抱着相当尊敬的心情与李世石对弈。包含避免喝水、离席、以及过多的脸部表情,都是基于尊敬李世石、不想要干扰他的比赛而产生的行为,这更让赛后李世石提到,与他对弈的黄士杰有着职业棋手的气势。黄士杰表示,在赛中他可能只有意外地笑了一次,而那次是因为李世石击败了AlphaGo,他由衷为李世石感到开心的笑容。

  然而面对李世石在第四局的78手落子,为何最终会导致AlphaGo的误判、导致这个人工智能最后选择投降,黄士杰表示这确实可能是AlphaGo的BUG,但目前还不清楚是策略网络的误判、还是价值网络提供了错误的讯息,DeepMind团队还在研究导致战败的原因。

  说到战败,黄士杰提到其实AlphaGo只要觉得‘没希望了’,就会主动投降,也就是在胜率低于20%的情况下,系统会弹出投降窗口,也就是在第四战大家看到的画面。但这并非意味着AlphaGo有办法事前预测和李世石对弈时,可能获胜的机率有多少。黄士杰强调,AlphaGo的胜率判断,必须基于和对方正式交手后才能判断,因此在还没比赛前,AlphaGo自己也不知道获胜的机会有多大。

  而这种判断机制,也让AlphaGo在第五战成功逆转胜。除了因为学习了李世石在前四战的棋路外,先前透过两个AlphaGo系统的自主对弈训练,也是让这个人工智能系统有着超越人类围棋能力的关键。

  未来AlphaGo有机会应用在其他领域上,特别是医疗领域,DeepMind已经有团队特别在进行这方面的项目。但对于人工智能不断发展,是否会出现类似‘天网’的人工智能威胁?黄士杰强调,人工智能的使用依旧取决于人类如何使用,而DeepMind团队也相当重视这个问题,Google内部甚至有伦理委员会,来决定科技的使用方式是否正确。

  至于AlphaGo未来会不会挑战其他项目,像是《星际争霸》这类的实时战略游戏?黄士杰认为短时间内不可能,主要原因是实时战略游戏不同围棋,他有太多不确定的因素,对于人工智能而言还太过困难。他特别指出,人工智能目前仍是早期阶段,还没有办法创造出主动式的意识,因此未来还有很长的路要走。

  看不懂围棋世纪对决?5件AlphaGo对战棋王你该知道的事情!

  文/记者谭伟晟

  在人脑于上周日(13日)扳回一成后,这场人脑计算机大战的最终回星期二(15日)中午在韩国首尔四季饭店举办最后一战,这盘棋中李世石改执先下的黑子,AlphaGo执后下的白子,在周日恢复水平取得一胜后,李世石这次面对GoogleDeepMindAlphaGo计算机最后一战,在中盘跟AlphaGo互有领先,但最后仍不敌AlphaGo,吞下最后一败,终战GoogleAlphaGo就以4:1的比数取得这5番战的胜利,获得100万美元的奖金。

  此刻科技界最受关注的大事件,恐怕不是iPhoneSE何时要举办发表会,而是Google旗下人工智能系统‘AlphaGo’,对围棋世界棋王李世石的对弈!这场在YouTube直播的精彩对决,将是AI人工智能发展的重要里程碑,这场比赛已经在韩国首尔展开,如果你还不了解这场对决,赶快搞懂以下这5件事情,并且看看外界对第一场对决结果的评论和看法!

  AlphaGO是什么

  由Google旗下人工智能公司DeepMind所开发出的人工智能系统‘AlphaGo’,在先前的围棋挑战中,已经击败了欧洲围棋冠军、职业围棋二段的樊麾,并且获得了5:0的完胜成绩。与过去知名的国际象棋超级计算机‘深蓝’不同,AlphaGo拥有更强的学习能力,因此可以在拥有‘提子’这类规则更复杂的棋类运动中,拥有与人类对弈的能力。

  其中Google内部的TensorFlow、DeepMind这两个团队扮演了极大的角色,透过类神经网络,AlphaGo能做到的并不仅仅只是以既有的信息持续推断最佳结果,而是能真正因应棋局而做出适当的下一步。过去在国际象棋比赛中表现亮眼的超级计算机‘深蓝’,严格来说只是一台运算更快的计算机,由于国际象棋没有‘提子’的规则,计算机只要持续判断棋局的可能棋路,挑选出最佳的下法即可,因此更重视计算机指令周期、而非学习能力。

  然而这在棋子数量随时会变化的围棋比赛上却不实用,因此类似AlphaGo的人工智能被认为是更适合的计算机挑战者。而Google在机器学习与深度学习的技术领先优势,也让AlphaGo这个人工智能系统,具备了足以挑战世界棋王的能力。

  在经历第一场的胜利后,开发AlphaGo的DeepMind团队相当兴奋,该团队创办人DemisHassabis甚至在Twitter上表示,这场胜利就像是登上月球般的创举。在第一场赛后的评论指出,AlphaGo的对手李世石,由于在中盘后的策略变得保守,同时接连出现失误,导致面对不会受情绪影响的AlphaGo时,败势无法扭转,最后让AlphaGo拿下首胜。

  对决的规则为何

  这次比赛将在3月9日、10日、12日、13日、15日这五天举行,每天都将会在台湾时间中午12点举办,全球观众都可以透过YouTube官方平台观看直播。首场挑战已经吸引了9万多人同时观看,实际开战地点是在韩国首尔的四季酒店。

  按照双方约定,AlphaGo人工智能系统将会以单独计算机运行,并且采用先前和樊麾对决的系统版本。规则采用黑子贴3又3/4子,比赛时间每方2小时、保留1分钟读秒3次。

  挑战的对象是谁

  12岁就成为职业棋士、赢过18座国际大赛冠军、今年33岁的世界棋王李世石,其独门技术‘僵尸流’可说是让他成为顶尖棋士的关键。‘僵尸流’的策略在于利用弃子战术,找出对方弱点、再将情势逆转反扑对方的战术。

  然而在面对AlphaGo的挑战,李世石也表示可能无法以5:0获胜、甚至有输的可能,最主要的原因在于人会有失误。在此之前,AlphaGo已经被认为拥有三段棋手的水平,尽管李世石被认为有着高于AlphaGo的实力,但连这位世界棋王都没有把握能够完全获胜。

  然而在第一场对弈中,李世石在第186手投子时承认落败。赛后接受访问时他提到,他没有想过会输,但也没想过AlphaGo的表现是如此完美。中国六段棋手孟泰龄认为,李世石可能会在第二战时找出AlphaGo的弱点、并且拿下第二战的胜利。

  对此这个状况,曾经与李世石对弈、并取得8胜2负战绩、被誉为中国围棋第一人的19岁围棋高手柯洁认为,由于李世石的棋风优势在于后盘,需要靠逆转取胜,然而对于运算愈来愈不容易出错的人工智能而言,更重要的反而是在开盘的布局。

  据传Google计划如果李世石不愿意接受挑战,柯洁将是第二顺位人选。因此在AlphaGo获胜后,柯洁马上在微博上表示,‘就算阿法狗战胜了李世石,但它赢不了我。’并且之后还自我推销了一下:‘看来围棋盲还是不少啊,在这里我简单介绍一下自己:我叫做柯洁,97年出生。现在暂时是世界围棋第一人(特地用了暂时,谦虚是美德)正式比赛我是单盘8:2碾压李世石(他赢得这两盘没有任何作用)世界冠军获得过三次(此年龄如此成绩前无古人)大小国内赛事冠军数次我本来真不想提这些得因为我是一个低调的人,是你们逼我的。’

  这场比赛如何进行

  这场比赛将会依循‘棋灵王’的佐为对决塔矢行洋的模式,也就是透过计算机棋盘来进行对决。具体方式是由李世石先在实际棋盘上落下棋子,接着透过对弈的代理人将棋路输入计算机中,接着在AlphaGo下好棋子后,再将棋子放置在真实棋盘上的相同位置。

  这场比赛的胜负意义为何

  Google承诺这场比赛若是由李世石获胜,将可独得100万美元奖金。若是由AlphaGo获胜,Google则会捐出100万美元给联合国儿童基金会(UNICEF)、STEM教育机构以及围棋公益组织。

  不过这场比赛之所以受到注目,更主要的原因在于这展现了目前人工智能的技术发展,是否已经达到人类思考的能力水平。由于过去AI人工智能在缺乏理解和思考的能力,因此尽管具备高速运算能力,但还无法作为协助人类思考的工具。

  因此这场比赛可说是人工智能技术发展的展现。其中AlphaGo如果获胜,不但能说明目前人工智能的发展程度,更可望让Google的技术能力更受国际关注。

文章关键词:人工智能李世石黄士杰围棋

点击下载【新浪体育客户端】,赛事视频直播尽在掌握
分享到:
收藏  |  保存  |  打印  |  关闭

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0
收藏成功 查看我的收藏
0 0 0 0