【AIWORLD2017世界人工智能大会倒计时20天】“AI达摩”齐聚世界人工智能大会,AIWORLD2017议程嘉宾重磅发布大会早鸟票已经售罄,现正式进入全额[详情]
中国古人下棋,无论输多赢少,都是要走到最后数下子的。在自身棋力的基础上,追求最好的结果,这是锤炼智慧和磨砺心性的一种方式。正因如此,围棋才被归到琴棋书画“四艺”之中,成为修身养性的道。然而近代围棋受日本和韩国的影响,围棋在竞技的道路上走得太远,胜负被看得太重了,直到人工智能的横空出世,才敲醒了正在“装睡”的围棋界。 为了竞技,围棋比赛的时间越来越短,惊心动魄的逆转虽然多了,却少了那种轰然天成的美感;关于贴目的分歧导致世界上到现在都没有一套统一的围棋比赛规则; 职业棋手们的棋力越高,却越离社会越来越远…… 不久前柯洁说 能够遇到AlphaGo是棋手们的幸运 未来若干年后,站在一个历史的高度,看我们这段时间的围棋发展的话,恐怕会是条曲曲折折的路线。好在AlphaGo出现了,它不仅带来了围棋技术上的革新,更给整个围棋行业的发展前路扫清了雾霾。 在新的时代,围棋赛制要怎么改变,围棋明星要如何定位,围棋与文化要怎样融合,在大时代变迁的关头围棋行业究竟面临着什么,这些都值得仔细思考。有幸的是,参加第二届商界棋王赛的八位棋王,从围棋爱好者和商界精英双重视角给了我们很有价值的分享。 围棋赛制新论 关于贴目贴多少的争论,围棋界就一直没停过。其实沿用中国古人的做法,可以有一种非常公平的比赛方式,那就是两人对阵,黑白各下一局,两局比总子数。这种比赛方式是乐工场董事长杨乐涛提出来的。这种算子的比赛模式在高尔夫围棋比赛中也得到了测试,很有合理性。 这样的比赛会出现势均力敌的和棋,但概率依旧非常低;铤而走险的不合理下法也要考虑承担更差的后果;两盘棋子数一起计算,胜负的博弈变得更加微妙;最关键的是公平。 乐工场董事长 杨乐涛 在发起人聂卫平的建议下,本届商界棋王赛采用了人机结合的赛制。棋手在比赛中有两次向人工智能求助的机会,由人工智能提供下法,辅助人类来做决策。金立集团董事长刘立荣认为这项赛制是个创举,而且非常有趣,令比赛增加了更多的变数。比赛的过程中也印证了这一点,刘立荣有着业余6段左右的实力,但在人工智能的参谋下,虽然次数有限,但发挥出接近职业水准的实力。 金立集团董事长刘立荣 不久前在东盟国际围棋邀请赛的论坛上,林建超将军说:“无论人工智能的围棋水平变得多强,也改变不了人类才是围棋活动主体的事实。改变规则是我们最大的武器。”未来的围棋比赛方式会变得多种多样,人们在其中体会到快乐才是最关键的因素。 围棋需要明星 “如果有再来一次的机会的话,我们可能不会让柯洁学围棋,就让他练他喜欢的舞蹈,正常的读书上学,慢慢成长,过普通的人生。”柯国凡说。胜负的世界已经如此残酷,柯洁还要肩负着整个围棋的推广,对这样一个20岁的少年来说,胜利和光鲜背后的付出,只有身边的人才知道。 特邀参赛嘉宾 柯国凡 从另外一种意义上讲,柯洁似乎又是为了这个时代而生的。柯洁从围甲连胜开始暂露头角,到雄踞世界第一的位置,再到人机大战的豪情,也才不过三年而已。而发生在柯洁身上的事情,已经可以拍好几部电影了。柯洁也以惊人的速度成长着,不仅是棋艺,更多的是为人处世的练达。 济南明仁置业董事长 周天乐 30年前,很多人因为聂卫平在擂台赛上神勇而接触围棋,成为棋迷;30年后,因为柯洁和AlphaGo他们又重新回到棋盘前,找到了当年的热情。济南明仁置业董事长周天乐就是这样。“柯洁其实已经成为一个品牌了,不仅限于围棋界,在全社会范围内都已经得到了认可。”周天乐与柯国凡是好朋友,经常会为柯洁提一些建议:“这些年柯洁最重要的事情当然是比赛下棋,但也应该有个长远的发展规划,甚至对接一些真正专业的经济团队。” 其实,需要包装和规划的又何止柯洁一个棋手,整个围棋行业都需要全方位的提升内涵和形象设计。 围棋与文化的融合 女子围甲联赛是中国棋界一项非常独特的风景线,虽然女子围棋的竞技水平还远不如男子,但这项比赛所引发的关注尤其是在围棋圈外的影响力非常惊人,各地分站赛主办的规格都非常之高。公益围棋教室捐赠、棋迷多面打指导棋更是让高高在上的职业比赛,有个更多贴近普通人的机会。 中信置业董事长 胡东海 中信置业从女子围甲联赛之初就一直鼎力支持,董事长胡东海只要时间允许,女子围甲的活动都会义不容辞的出场站台。明年女子围甲联赛的主题是 “扶贫”,到偏远不发达地区,帮助人们“启智”,胡东海表示要加大投入:“这是我们中信集团的社会责任。” 中信置业河南总经理 章广跃 同样与女子围甲有着千丝万缕联系的是中信置业河南总经理章广跃,女子围甲河南队一直是他在背后支撑,洛阳的很多围棋活动也有着他的支持。章广跃对围棋文化情有独钟,在他的全力以赴和中信集团的坚强后盾下,中国第一个围棋小镇将在洛阳正式启动了。这可能将是中国围棋行业发展历史上,堪比首个世界大赛创立的壮举。 整个时代面临的变革 华奥星空董事长 王平 王平作为华奥星空的董事长,看到的不局限于围棋,整个体育行业都面临着大时代的变革。一方面是中国正处在高速发展的阶段,体育产业正面临着与全社会接轨的关键时期,是提升人们幸福指数的关键一环,围棋也有着属于自己的机会。另一方面,人工智能的出现让体育行业以前很多不敢想象的设想和服务都成为了可能,还是以围棋为例,人工智能辅助工具就能大大缓解现有的围棋培训行业师资短缺的瓶颈。 信柏科技创始人 柏林森 柏林森创立的信柏科技最开始做的就是大数据领域的应用,随着人工智能技术的成熟,他的团队已经开始在金融和医疗领域拓展实际应用的场景。柏林森最大的爱好是看DeepMind的各种论文,他说人工智能代表着这个时代的先进生产力,我们要想办法离它近一点,在大变革到来的时候才能不被淘汰。 (周游)[详情]
来源:围棋编辑部博客 原址:https://book.mynavi.jp/igo/blog/detail/id=87113 大家好。我是编辑部的山本,现在很希望家里能有个被炉。 今天来介绍一款软件。锵锵! 天顶围棋7 ZEN 这一版本的ZEN最高棋力达到了职业九段! 发售前我们请了职业棋手与其以分先进行对局,据说ZEN能与职业棋手势均力敌,还赢了几盘。 当然,对局时的性能也很重要,但最能帮助使用者增长棋力的还要数研讨功能了。 棋手中首屈一指的围棋AI研究家大桥拓文老师对ZEN做了以下评论: 让大家翘首以盼的天顶围棋7终于发售了。 无愧于此前流传的高评价,天顶围棋7的确是有职业水平,有时会下出连我都觉得伤脑筋的严厉招法。 我在和它玩时也发现了许多有意思的使用方法。 我想大家肯定都各自有拿手的作战策略、喜欢的布局。如果你想进一步完善自己的策略、布局的话,这时就该轮到天顶围棋7华丽登场了。摆出自己拿手的布局,点一下右上的研讨按钮试试吧。它会为你提供若干十分有力的下一步的候选,还会显示这些候选点的评估值(即胜率)与搜索次数。虽然大家一般都会比较在意评估值,但模拟次数也十分重要。搜索次数越多,评估值也就越准确。同时参照着这两项参数来思索、制定策略是件十分有意思的事。 评估值是以胜率来表示的,我想有人可能不太习惯,所以在此简单介绍一下(天顶围棋7所表示的)胜率的基准。 显示50的话也就是50%,自然就是双方不相上下的局面。60%是略好。70%是优势。80%的话可以说胜利就在眼前了。差不多就是这样。但要注意一点,即使只领先1目半左右,到终盘时也有可能会显示胜率为90%。90%给人感觉差距很大,但1目半对人类而言只是很小的差距。了解这一点,有助于更好地使用天顶围棋7的研讨功能。 至于序盘,评估值在40%~60%之间时可以理解为某一方只有极小的优势。而双方不相上下时胜率则会在45%~55%的范围之间波动。 为了研究序盘下法,我也开始使用天顶围棋7了。它给出了好多特别有意思的下法,我感觉我一时半会儿是放不下电脑了。 ——大桥拓文。 研讨画面示意图如下: ZEN7研讨画面 红框框起来的部分显示有“候选点”、“搜索次数”、“评估值”。 天顶围棋7显示的这些参数都非常准确,甚至连职业棋手都能从中学到很多。如果好好利用,想必棋力能够大幅提高吧。 购买地址:https://book.mynavi.jp/ec/products/detail/id=77803 英文版:https://book.mynavi.jp/ec/products/detail/id=79528 天顶围棋主题网站:https://book.mynavi.jp/tencho7/ 今后还想写一些关于天顶围棋7的推荐使用方法一类的文章。 那么还请大家多多支持天顶围棋了! 天顶围棋作者加藤英树 (朱东冬)[详情]
晚上好各位,11.15深圳大学围棋节拉开序幕,晚上有聂老和诸位名手的座谈会,吸引了诸多学子到场。封面为女子世界冠军徐莹老师隆重介绍聂老。 场面十分热烈 现场嘉宾包括世界冠军、聂老弟子常昊老师 深大学子世界冠军唐韦星 深大学子世界冠军周睿羊 擂台赛当然是聂老座谈会不能略过的话题,聂老:我赢了大竹英雄以后,邓小平亲自给我家里打了电话,但是那时候我还没回去呢。 聂老:我上场前坚信我能赢小林光一 徐莹老师:您为什么这么坚信啊 聂老:凭实力啊! 聂老:我赛前研究了很多小林光一的棋谱,发现他的对角胜率要比一边的低,所以我和他那盘选择了对角 聂老:听说当年财政部要降低围棋的伙食标准,我说这不行啊,就给总书记打了个电话,总书记说,谁敢降低你们的伙食?我说财政部,总书记说,谁敢降低你们的伙食,给我降低财政部的伙食。 随后聂老和学子们分享了对AI围棋的一些心得 聂老:李世石和AlphaGo第五盘,当时角上一个局部,大部分职业棋手都觉得李世石好,或者好不少,我当时觉得AlphaGo略好,后来看AlphaGo要好的多 嘉宾一览[详情]
2016年的年初,柯洁和李世石完成了经典的五番棋对决。坐在棋盘一端的,是统治围棋世界过去十年的王者,另一端的,是如狂风呼啸,席卷棋坛的天才少年。这样的场景,曾经在十多年前发生过,那时候的李世石,还是有着青涩笑颜的,刚从飞禽岛走出的不败棋客,而当他带着一身少年意气,坐在了李昌镐的对面,我们都知道,围棋世界,将要翻开新的篇章。 少年子弟江湖老,旧日的少年成了今日的王者,而今日的王者也将面对新的少年。围棋世界的代际交替,像是春秋迭换里注定绽放的花朵与注定凋零的秋叶,是造物写就人力难敌的残忍与动人。决赛前,柯洁说,“李世石之前说他有五成希望取胜,我想如果一共是一百成的话,他有五成。另外我想说,传奇是时候落幕了”。围棋世界里,已经有多漫长的岁月,没有听到过这般裹挟着万千少年气天才气的话语了? 上一句,大概正是当年李世石对着李昌镐说出的,“在所有高手中,昌镐的力量应该是最差的”。十三年流光电逝,如果李世石想得起当年旧事,大概也会笑这岁月写就的剧本。更有趣的,是当年李昌镐和李世石,如今的李世石和柯洁,五番棋对决的结果,都是3:2。唯一的不同,只是这一次,更年轻的那个人赢了。 对于李世石而言,这是悬崖边上的战斗。他已经过了而立的年岁,在更新换代越来越快的围棋世界里,他只能一直赢下去,一旦他输掉,“李世石老了”的舆论,就会像潮水一样涌来,将他瘦削的身形淹没。此前,哪怕他立于围棋世界绝巅的时候,他也像是一只遗世独立睥睨天下的狼王,和他一生的好朋友好对手古力相比,他更敏感纤弱,却也更凌厉狂傲。他刚出道的时候,《围棋天地》做了一期专题,题目简简单单,“世石如豹”。十年匆匆,当我们在世界大赛里一次又一次的看见李世石的身影,当他做出的一件又一件事情惹得我们惊叹不已,我们或许才能真正看出他的真正样子—他从来,都是狼王。 而如今,这只站在围棋世界最高处的狼王,已经老了。可是,守在自己领地上的老狼王,大概,才是最让人恐惧的事物。 2015年全年执白不败的柯洁,在年末的五番棋第一局,终于破了不败金身。李世石厚重稳健的棋风收到了效果,在对手棋风的突然转变面前,柯洁仿佛并没有准备好,他对中后盘的判断始终太过于乐观,而当发觉不妙时,已经为时太晚。这是2015年12月30日,柯洁这一年的白棋战绩,也终究定格成了34胜1负,白壁微瑕,终有遗憾,却也是对于这位新科世界王者的提醒,因为不圆满,所以在新的年份里,才有更多的进步可能。 这是老狼王的回应,是面对侵入自己领地的年轻人,最直接最决绝的回答。想要王座,那就用撕咬,用战斗,用血和泪,亲手拿过去。 决赛第四局,柯洁不敌李世石 第二盘,开盘未久,柯洁便出现了误算,黑棋长考后下出101、103两手粘,被李世石脱先分断,将右侧黑棋直接歼灭,研究室里的聂卫平棋圣留下一句“败局已定”便离开研究室,对于所有人而言,仿佛0:2的结局已然注定,柯洁这一次向着王座的冲击,也终将蒙上一层太深重的阴影。所有人都这样想,除了正在下棋的柯洁自己。从网棋世界的摸爬滚打里,从围甲难求一胜的境遇里走出的“潜伏”大帝,从不会轻易将“失败”当成理所当然。而柯洁的坚持也终于等到了奇迹的诞生,进入读秒阶段之后,李世石连续出现失误,柯洁用屠龙的方式,完成了死里逃生的神奇逆转,也让胜利的天平,再度回到了双方均衡的位置上。 第三盘,李世石再度早早进入读秒,也再一次在读秒阶段输的溃不成军,然后,在李世石两盘误算之后,柯洁用第四盘149、153两手致命败着当做回应。这是战斗,是新老王者们为了权杖,也为了他们身后代表的国家棋运的殊死搏杀,“争棋无名局”,这样的对局,是拳拳到肉,是剑影漫天,我们看得到柯洁和李世石所有的情绪,那些欢喜与黯然,都在脸上写的明明白白。因为太重要,因为太渴盼,所以才会在这样的对阵里,留下不那么精彩的棋谱,毕竟,哪怕天才超卓如他们,也终究,是有血有肉有喜有泪的,活生生的人。 而围棋,也正是在这样的战斗里,才拥有了让我们心驰神迷的魅力。那些失误与突然死亡,那些奇迹与惊天逆转,那些执子的手与对视的眼眸,那些一直鲜活的可能性,他们留下棋谱,留下故事,让我们依旧此时此刻依旧感知得到他们当年的紧张与焦灼,身下万丈绝顶,身前璀璨群星。 柯洁夺得梦百合杯 柯洁夺得第二届梦百合杯冠军 2:2,决胜局,一战决胜败。没有比这更传奇的剧本,而这传奇的一战,也终于用传奇的方式告终。前半盘柯洁优势的情况下,却在一处打劫中不慎误算,揪着自己头发表情痛苦的柯洁,牵动了万千棋迷的内心。赛后,柯洁表示,自己一直点错目,以为自己输了,中间甚至一度要认输。还想过输了之后要“削发明志”。但看起来,围棋女神似乎比较喜欢柯洁的头型,并没有让他换造型的打算,直到最后一刻才被看清楚的胜负,以黑棋粘劫收后,半目胜利而告终。这是中国特有的规则,胜的惊险,胜的艰难,但归根结底,少年走出了那一步。他从前辈手里,接过围棋世界王者的权杖,一年三冠,海阔天空。 在那一刻,我们看着领奖台上意气风发的天才少年。那是中国围棋的荣耀,他已经成为了中国围棋漫长历史上,古力、常昊、孔杰后的第三位三冠王,他已经走在了李昌镐李世石曹薰铉们曾经走过的,独属于大棋士的传奇道路上。 如果,一切外力都未曾发生,此后的围棋世界,大概将会流淌的波澜不惊。像是曾经发生过的,新王者接过老王者的权杖,于是战国时代,终究又归成一人独尊,围棋世界,也依旧会按照自己的逻辑,安宁又缓慢的运行。但是,2016年3月,当在那个凛冽初春里,李世石和人工智能相遇的时候,我们早已预想的那个未来,却仿佛被蝴蝶扇了一下翅膀,从此,整个围棋世界,地覆天翻。 和李世石决战之前,AlphaGo最好的战绩,是击败了职业棋手,欧洲冠军樊麾。但是,欧洲冠军和世界冠军的差距,让所有职业棋手都依然相信李世石能够轻松获得胜利。在人们眼里,这项世界上最难的智力游戏,还远远没有到被人工智能轻易击败的时分。崔丙圭九段说,“计算机向人类顶尖棋手挑战,怎么说也得先摆上两三子吧?计算机程序战胜人类,时机还是尚早”,李世石自己也说,要争取“不让电脑赢到两盘”。 但是,当在首尔四季酒店沸沸扬扬的记者人群里,当在全世界的镁光灯下,我们看着棋局走向一个我们想不到的结尾,那是历史性的时刻,人类冠军终究在人工智能面前败下阵来,而且,一败就是三场。从遗憾到绝望,从震惊到麻木,我们仿佛已经在接受这样一个事实,人工智能已经确确实实的在围棋领域超过了人类高手,我们在曾经引以为傲的,不可能被电脑攻克的领域,溃不成军。 人机大战 而也正因为如此,我们才如此珍视李世石在第四局中的这一胜,我们也都知道,在这一胜之后,下一场胜利,已经不知道会在何年何月,甚至,不知道它还会不会到来。78一手挖,这是如鬼似神般的一击,过去十年里人类棋坛无敌的王者,在最需要他站出来的当口,用他瘦削的身形,给围棋世界,也给所有关注着人机大战的人们留下一个永远闪耀着的背影。新浪从首尔发回的新闻,最后是沉甸甸的几个字,“李世石,谢谢你”。 人机大战第四局李世石改变历史的一胜 我们希望李世石失败了太久,而这一次,当我们终于希望他不要失败的时候,他没有让我们失望。 “三连败后终于一胜,此刻的喜悦真是难以形容,这一胜太有价值,我不会用任何东西来换”。颤抖的嗓音和如释重负的神情里,我们见到的,是我们从来没有认识过的那个李世石。有报道说,在连续输掉三局之后,李世石在路上只要见到围棋相关的人就会连续说“对不起”,李世石的夫人说,晚上偶尔睡醒,就能看到李世石在凉台上对着棋盘叹气。一生意气纵横,一生不弱于人,那一刻李世石的心绪,也许只有未来一年的柯洁能感同身受。我们都知道,这一次,李世石是真的发了狠,要把整个人类的胜负,扛在自己肩上。 神雕侠侣里,杨过问郭靖,“郭伯伯,你说襄阳守得住么”,郭靖沉吟良久,手指西方郁郁葱葱的丘陵树木,说道,“襄阳古往今来最了不起的人物,当然是诸葛亮。此去以西二十里的隆中,便是诸葛亮当年耕田隐居的地方。诸葛亮治国安民的才略,我们粗人也懂不了,他曾说只知道“鞠躬尽瘁,死而后已”,至于最后成功失败,他也看不透了”。我与你郭伯母谈论襄阳守得住守不住,到最后,也总只是“鞠躬尽瘁,死而后已”这八个字。 襄阳终究是守不住的。才气卓绝如李世石,当然也知道,他所坚守的阵地,总会被人工智能攻克。但他依然奋力搏杀到了最后,正是因为这一胜,我们才等来了第二年里,人工智能和人类王者的又一次交锋,我们才能在失败面前,依旧骄傲的讲出,我们要向人类“脱帽致敬”。 但是,这一切,却终究只是在命运写好的轨迹里,以个人的风华绝代,带来的那么一点微小的改变。1:4和0:5,太不一样,却同样是人类的败北,我们都已经明白,人工智能只会将人类越抛越远。2016年年末,当Master在野狐和奕城横扫人类高手完成六十连胜,当一位位人类棋手决绝的冲向人工智能,却收获一次又一次失败的棋局,一切的结果,其实早在柯洁和AlphaGo的江南决战之前,就已经板上钉钉。 围棋世界的浩荡长河,在命运的重重一击下,刹那间变了走向,翻卷着无数身处在这个变革时代的小小浪花,走向了茫然不可知的星辰大海。浪花们愿意按照原有的轨迹流淌,还是像如今这般,毅然决然的冲上礁石、冲向未知、冲向我们称之为“道”的渺远未来?个人的命运在宏大的时代叙事之前,显得微小又虚无。即便他们,是这项人类最难的智力游戏中最卓绝的天才,但终究,也只是这个伟大时代里,充盈着喜怒哀乐的,同样看不清自己前路走向的小小的“人”。 你看着他们,用坚忍不拔的勇气和永不放弃的决心,飞蛾扑火一样的,冲向注定将远远把他们抛在身后的人工智能,以对天拔剑的勇气,收获早已注定的败局,求仁得仁,求义得义,他们在变革的时代里用自己落下的每一颗棋子堂堂正正硬硬朗朗的写下“棋士”两个传承千年的名字,但是,一生争胜从不言败的他们,却终究因为失败,而被史笔记下,被更多的人记住。 多喜悦,多悲哀。 当然,这还不是最后的时刻,在来年的五月,在江南水乡青砖白瓦,人类新王和人工智能,还会完成让世人瞩目的番棋较量,但是,那,已经是这绵延了太久的,属于“人机大战”这个意蕴万千的名词的,一个意味深长的终结符。 在开年的时候,在柯洁和李世石对战的时候,我们不会想到这一切。我们依旧可以选择留在过去,但围棋不能,它在用比我们想象的快得多的速度前行,我们每个人都依旧微小,但这,确实已经是围棋的大时代了。 谨以此,献给刚刚过去的,变革的2016。 2016年中国围棋大事录: 2016年1月,柯洁击败李世石,获得梦百合杯冠军 2016年10月,唐韦星击败朴廷桓,获得应氏杯冠军 2016年11月,党毅飞、周睿羊会师LG杯决赛 2016年12月,陈耀烨击败柯洁,获得百灵杯冠军 2016年12月,柯洁击败柁嘉熹,获得三星杯冠军 2016年年末,范廷钰在应氏杯完成七连胜 (未完待续) (谢天舒)[详情]
来源:柳渝的博客 作者:柳渝。 摘要:继AlphaGo完胜人类棋手后,AlphaGo Zero完胜AlphaGo Master,恰恰表明了作为人工智能的围棋机器的技术性本质。中国古围棋在日本的职业化也是围棋的技术化,这是今日围棋机器完胜人类的必然。中国围棋的文化本质蕴含于棋艺和棋道之中。围棋的棋理只有在科学与人文和中、西文化的交叉视域中才能得到真正的阐释。 目录 一,AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予 二,围棋盘棋上的棋理 三,围棋的职业化与技术化 四,围棋的棋艺与棋道 五,结语 AlphaGo以学习人类经验棋谱而战胜了人类棋手,成为了人工智能的时代标志,而AlphaGoZero则以“白板”(tabular rasa)学习而再次成为头号新闻,英国经验主义哲学家洛克(John Locke,1632-1704)著名的“白板”说(theory of tabula rasa)认为,人出生时心灵像白板一样空白,通过人的经验心灵中才有了观念和知识,洛克认为经验是观念、知识的惟一来源。AlphaGo Zero的“白板”是指与人类经验棋谱相对的空棋盘,即从0开始的“学习”,但洛克的心灵“白板”是人从现实经验中认知或学习,两者的区别就在于AlphaGo Zero不需要人类的棋谱经验而是自己与自己在棋盘上对战的“经验”,这个区别的微妙之处就在于人类的经验与机器的“经验”有何本质的不同,这与AlphaGo对人类的伦理挑战不同,AlphaGo Zero的“白板”是对人类哲学问题的一个挑战,这些问题都深刻地与我们对人工智能的本质的理解和定义有关,实际上已经成为了今天我们对人的智能的基本认知理论的更新,其意义远超过AlphaGo Zero的成功。 就AlphaGo Zero的具体情况来说,本文讨论1。AlphaGo Zero的“白板”与人类的心灵“白板”有何不同?2。AlphaGo Zero自我对弈的经验与人类的经验有何本质的不同?我们可以在智能哲学的论域中研究这些问题的深刻意义。 一、AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予 DeepMind团队在“自然”杂志上发表的论文,推出了人工智能围棋程序的最新版本的更强大的“学习”能力,AlphaGo Zero:Mastering the game of Go without human knowledge (无需人类知识的围棋大师),据称,AlphaGo Zero以100 : 0的成绩击败李世乭版本的AlphaGo。(http://nature.com/articles/doi:10.1038/nature24270,中文介绍可见:http://mp.weixin.qq.com/s/68GTn-BaiRPmzi9F-0sCyw)最引人注意的地方是,“我们介绍一种单独基于强化学习方法的算法,无需人类数据、人类的指导,或超越围棋规则的领域知识。AlphaGo成为了它自己的老师,”(we introduce an algorithm based solelyon reinforcement learning, without human data, guidance, or domain knowledgebeyond game rules。 AlphaGo becomes its own teacher)。 这篇论文的第一作者、AlphaGo项目负责人DeepMind的David Silver在采访中这样解释说: -AlphaGo Zero完全从“乱打”(随机)开始,不需要任何人类数据从最初原理开始而取得最高的综合棋艺水平。AlphaGo Zero最重要的理念就是它完全从无知状态开始学习,也就是从白板(tabular rasa)上开始,从自我对弈中领悟,不需要任何人类知识或人类数据,不需要任何人类经验、特征或人类的干预。它去发现如何从基本原理开始下围棋。因此白板学习对我们DeepMind的目标和雄心非常重要,因为如果你能得到白板学习,你就得到了一个代理,它可以从围棋移植到任何其它领域。你就从你所在的专业领域解放了出来,你得到了一个算法,它具有普遍性可以应用到任何地方。对于我们来说AlphaGo的意义不在于下棋战胜人类,而是去发现从事科学工作的意义,从程序的自我学习能力中了解知识是什么。我们开始发现,AlphaGo Zero不仅重新发现了人类下棋时的常用模式和开局,以及人类下在棋角上的定式,不仅是学习、发现这些而且最终放弃它们而采用自己的模式,其中有些甚至是人类不知道的或现在还没有用过的。因此我们可以说,事实上在短时间内AlphaGo Zero学到了人类上千年积累的围棋实战知识。AlphaGo Zero下棋中分析,靠自己发现更多的知识。有时候它的选择甚至超过这些,得到一些人类在这个时候尚未发现的东西,在不同的方式上发展出具有创意的新的知识点。 (AlphaGo Zero which haslearned completely from scratch, from first principles withoutusing any human data and has achieved the highest level of performance overall。 The most important idea in AlphaGo Zero isthat it learns completely tabular rasa。 That meansit starts completely from a blank slate and figuresout for itself only from self-play, without any human knowledge, without anyhuman date, without any human examples or features or intervention from humans.It discovers how to play the game of Go completely from fist principles。 Sotabular rasa learning is extremely important to our goals and ambitions at DeepMind。 And the reason is that if you can achieve tabularasa leaning, you really have an agent that can be transplanted from the gameof Go to any other domain。 You untie yourself from the specifics of the domainyou’re in and you come up with an algorithm which is so general that it can beapplied anywhere。 For us the idea of AlphaGo is not to go out and defeathumans, but actually to discover what it means to do science, and for a programto be able to lean for itself what knowledge is。 So, what we start to see wasthat AlphaGo Zero not only rediscovered the common patterns and openings thathuman tend to play, these joseki patterns that human play in the corners。 Italso leaned them, discovered them and ultimately discarded them in preferencefor its own variants which humans don’t even know about or play at the moment。 And so wecan say that really what’s happened is that in a short space of time, AlphaGo Zero has understood all of the Go knowledgethat has been accumulated by humans over thousands of years of playing。 And it’s analyzedit and started to look at it and discover much of this knowledge for itself.And sometimes it’s chosen to actually to beyond that and come up with something which thehuman hadn’t even discovered in this time period。 And developed new pieces ofknowledge which were creative and novel in many ways。 ) DeepMind强调AlphaGo Zero从白板上开始自我学习,这是指机器进入包括训练或实战状态时不从学习巨量的人类数据开始(People tend to assume that machine learning is allabout big data massive amounts of computation),但这时的AlphaGoZero本身并非白板(裸机),也并非只包含了“操作系统”的纯净机器,而是具有了强大的机器学习能力的机器,David Silver说 “但实际上我们从AlphaGo Zero中发现,算法比所谓计算或可用数据更重要,事实上我们在AlphaGo Zero上使用的计算(量)比过去在AlphaGo上要少一个数量级,这是因为我们使用了更多原则性算法。“(But actually what we saw in AlphaGoZero is that algorithms matter much more than either compute or dataavailability。 In fact in AlphaGo Zero, we use morethan an order of magnitudes less computation than we used in previous versionsof AlphaGo。 And yet it was able to perform much higher level due to using muchmore principled algorithms than we had before。)正是由于AlphaGo Zero具有这种“先天”的学习能力它才能一开始就可以自己学习自己。 DeepMind在AlphaGo Zero建造中使用了包括AlphaGo在内的很多精练的算法。因此实际情况是非常复杂的,AlphaGo Zero开始工作时并不是一台“裸机”,也不是只有操作系统的“纯净机”,而是一台“智能机”。这里不仅有传统图灵计算的算法,也有人工神经网络“代理”计算能力,即有机器本身的操作系统,也有功能计算能力和解决具体问题的功能算法或智能代理能力,这些高能力算法不是AlphaGo Zero自己学习得到的,而是人类赋予的“先天”性的人工智能,这也是AlphaGo Zero一开始就能向自己学习的原因。 二、围棋盘棋上的棋理 今年的法国科学节上,儒勒·凡尔纳公立综合大学(Université de PicardieJules Verne)第一次以科学介绍方式向公众展示中国围棋和包含其中的文化因素(亚眠“科学节”——围棋从中国到法国的旅行),在向完全不懂围棋为何物的观众简单地演示如何学下棋时,采用了两种现场教学方法。第一种是先介绍最基本的下棋规则,然后让学习者下子,这时参与者每下一子要费周折,第一粒棋子放在什么地方是很大的困惑;第二种方法是先让观众任意下子,然后在教学者的陪练中亦步亦趋地学习可行的落子方法。很明显,后者不但使事前完全不懂围棋的观众能够马上下棋,而基本上知道了什么是围棋,领会他任意落下的棋子都充满了奥秘,对围棋产生了兴趣。这个情况引发了我们进一步的思考,围棋的规则虽然简单,但与棋盘上的直接经验相比,对新手的认知、学习具有很大的区别。围棋的规则是围棋作为游戏的设计性思想的体现,而棋盘上的直接落子则是在现成的游戏世界中的经验行为,前者是人类知识的体现,而后者是作为游戏角色的经验,对于一个新手来说,后者是在棋盘上的经验中的学习。为此,我们研究作为围棋棋盘的特殊性。 围棋是在平面直交空间上的占领游戏,这对不懂围棋的人特别是西方人有一种困惑:是不是只要将棋盘上放满棋子了就可以决定胜负了?这样几乎等于没有规则,这也就没有游戏的意义了。与一般游戏规则不同,下围棋不仅是按游戏规则的“以棋行事”,而且是对弈过程中对棋盘与棋子所形成的“局面”不断地认知更新与决策,围棋的“局面”就建立在棋盘的平面直交网格的几何特殊性上。 围棋的棋盘是一种简单的平面直交网格,是平面几何空间上最基本的形式结构,围棋就是在这种最简单的直交网格上占领对弈。平面直交网格实际就是欧氏几何平面上的坐标系,在这种平面直交网格上的游戏的形成或设计实质就是对欧氏平面的基本性质甚至是潜在性质的利用和开发,中国围棋内涵的丰富性正是基于这种几何性质的深刻性。首先,在围棋中,棋盘上的直交网格的每一位置被赋予非几何的意义:空或占有、死或活、0或1,实现了几何性和数学性的人为超越结合,这是围棋棋理研究的理论基础。 以数学眼光对围棋进行过精深研究的英国数学家 John Horton Conway 发明的“生命游戏”(Game of Life)或称“元胞自动机”(Cellular Automaton)就是在直交网络上进行的一种位置格局迭代过程,每一格局的迭代由一个选定位置与其邻接位置的相互控制关系决定。这种迭代过程是算法能行的(可以程序化),但这种迭代产生的平面复杂格局可以表现为一种有规则的图形,这种事前无法预见的复杂现象就像生命现象的涌现和演化一样引人注意(注意这里有一种错觉,屏幕上生命游戏中的图案仍是由机器以算法形式产生的)。但由于平面上的位置组合是指数增长的,现有设计的可以实现的生命游戏的算法程序都无法穷尽,这种情况造成一种误解,只要有无限的空间和时间,生命游戏就可能演化出任意复杂事物,但实际上并没有进行这样的大规模研究的意义。生命游戏就是平面直交网格的几何性质表现为图案形式的算法的一个范例,但作为电子“游戏”,只能说是一种知识性的娱乐。 与“生命游戏”的图案迭代变化不同,围棋不是棋子与盘面之间的简单占领关系,围棋对网格位置的占有是对抗性的,即在直交网格上已经人为的赋予基本结构性意义的情况下,再以黑、白落子表示对抗性地占有,因此围棋的盘面是双方对抗性布子所形成的“局面”,就是说,围棋的“局面”形成既不是由程序(递归)决定的,没有如生命游戏事前的变量设定产生的算法制约性,而是不断的认知更新和决策的对抗游戏,任何“局面”不只是棋盘上的棋子与棋盘网格的占有关系,更是双方对潜在盘面的认知、信念和决策。因此弈棋不是上一局面的算法的连续迭代,而是双方棋手独自看局的直觉判断和策略的博弈,同一个盘面各人所看的局面并不相同,在双方的视野中可以有具有很不同的意义,因此围棋能体现个人的智力直觉,围棋规则简单但“易学难精”,就是对人的直觉的自然性与自觉性的超越要求。对同一个盘面双方对抗性地具有不同的理解和控制的智力竞技才是围棋表现为一种高级游戏的原因。相比于象棋等各自组织攻防战术的游戏,围棋具有更强的不完全格局和盘面全局性关系直觉与理解能力的要求。 人类围棋的高手是经历了自己的长期实战和对历史棋谱的无数揣摩而形成的,每一盘棋从落子“开局”起是在弈棋过程中个人与历史经验的综合后的再实践。而AlphaGo Zero之所以能够从白板开始(实质是“随机”开始,区别于“监督学习”喂入人类棋谱)学习,是因为它已经具有的人工赋予的人工智能的先天性。 AlphaGo Zero真正的区别性应在两方面考虑,1。区别于人,人类心灵的“白板”是指人类和知识来源于经验,人类棋手是有了围棋的规则和历史经验的知识,不同经验者之间的对抗性竞争。2。区别于AlphaGo的“监督学习”,AlphaGo Zero是在包括AlphaGo研究、设计、建造和实用所有经验基础上的围棋游戏的算法重建。 AlphaGo Zero的随机性“白板”开始实际是受其内置的人工性智能和盘面上直交网格的几何-数学性质两方面约束的。AlphaGo Zero本身就是“智能机”,能够在棋盘这种有限世界中重建一种机器对机器的对抗性。AlphaGo Zero真正的进步是作为人工智能的“机器学习”的“强化学习”(reinforcement learning)的一次成功实现。 我们可以看到,AlphaGo Zero并没有创造一种不同于现有围棋的新规则的围棋,只是在不断的自我对弈中重建了已有的围棋系统。AlphaGo Zero凭借并其巨大的机器时、空能力,以超过人的生物时空能力而取得对人的全胜,以对以往AlphaGo版本研究经验的综合和提高取得对以前的AlphaGo的全胜。 三、围棋的职业化与技术化 围棋在中国诞生,大约七世纪在日本流行,围棋的中国文化性与日本文化之间的混合具有很特殊的文化研究价值。 据有关记载,奈良时代(公元710—794)围棋开始在日本宫廷盛行,并有出入于宫中的职业棋师。镰仓时代(1185—1333),围棋在习惯于战场生活的武士中传播开来,几大封建领主(大名)织田信长、丰臣秀吉、德川家康都具有相当的棋力,民间出现围棋大家,如先后侍奉于织田信长、丰臣秀吉和德川家康的僧人日海(1558—1623),被誉为围棋“名人”、“棋所”,享有优厚俸禄,得到“官命”,并总理围棋事务,指导将军弈棋,垄断围棋等级证书的颁发等权力。1644年幕府建立了“御城棋”制度,参加“御城棋”被看作与武士们在将军面前比武同等高尚,这样,围棋对弈植入了武士道精神。日本武士道崇尚正直、信义、忠诚、礼节、廉耻、简朴、坚毅、胆识、诚实等种种美德,武士道精神以个人荣誉立命,一但丧失个人荣誉,武士不得不进行切腹自杀以保全最终武士荣誉。因此,职业化的围棋赛事程式、规则、棋手段位、个人棋风等等都与荣誉相关,正式赛事中战败者被迫降低交手棋分,这种在赛事中的降格被视为棋手的奇耻大辱,因此棋枰上的血腥之气迎面扑来,正式棋赛中的棋手几乎是押上自己一生名誉和身家性命作孤注一掷,甚有在对局中口吐鲜血或当场死亡的事例。 围棋的职业化使围棋成为一种正式的社会活动,吸引了广泛的社会参与。以当时的“棋所”四家(本因坊、安井家、井上家、林家)为核心,民间和名门望族的六段棋手均可参加棋赛,日本在职业化的道路上进一步成为日本社会生活的一部份,一直影响到以后围棋在日本社会生活中的地位。 进入现代以后的日本围棋文化受到商业和新闻业的强力支持,大体以棋院形式组织起了所有的围棋活动,围棋文化进一步普及化,全国和国际赛事成为了重要的社会性事件。围棋的职业化使棋赛的胜负之争成为主要目的,日本围棋的某些规则也与中国围棋不同,段位等级的激烈棋赛和社会强烈关注使围棋的职业化更加突出,也就使正式的围棋活动成为了竞争技术和职业化的高级技术训练。 围棋界的高手都不同程度地强调下棋的心态、境界,这主要是为了得到对棋盘局面的深度理解,由于围棋局面的形成是平面几何空间中的直交网格结构的深度重组,落子意味着对棋局发展趋势的决策,是历史经验与当前态势的偶合,因此棋手必须专心致志,使经验与个人气质结合而形成个人的棋风,棋赛中要排除一切杂念,凝集精力于直觉(棋感),使个人形成特殊的风格在当前不确定性的棋局上产生偶合,以期得到“妙手”、“鬼手”、“神之一手”,使一子之后产生一个全新的局面。所以这种基于战杀的心态培养和训练仍然是一种心理性的技术性的准备。 围棋的职业化使棋手把下棋作为社会生存的方式或手段,从而在本质上使围棋与个人的一般生活区分开来,成为某种个人的社会生存方式,同时,围棋职业化、专业化也就使职业化围棋必然走向技术化的道路。正是这种围棋的职业化和技术化使AlphaGo成为了今天人工智能研究项目中最大的成功,这也就是AlphaGo和AlphaGo Zero完胜人类的必然性前提。 四、围棋的棋艺与棋道 围棋在中国文化中大体是文人雅士的修性、娱情的文化活动,中国的古棋优雅、自由、超越,弈棋轻松、理性互动、无言而喻,故称“手谈”、“坐隐”。 “坐隐不知岩月乐,手谈胜与俗人言” (黄庭坚,弈棋二首呈任公渐),虽然偶尔以兵喻棋(“略技”),但非以棋为兵,更没有争命的意义,相反,常以棋局喻世态而求超然,与中国特色的神仙思想相呼应,人在棋局中,又在棋局外。“烂柯”这个故事的喻意就深得人心,南朝梁任坊的《述异记》和历代其他一些笔记中均有记述,其大意是,樵夫王质入山伐木,见两人在松下石台上对弈。王质观棋入迷,一人递了一枚枣子给王质,王质吃后不知肚饥,后来一人提醒王质:“你怎么还不回去?”王质回头看他的斧头,斧柄竟已烂掉,当他下山回家时,人间已逾百年。甚至宋徽宗赵括也说“忘忧清乐在棋枰”。 “礼、乐、射、御、书、数”是士人在受教育阶段接受的主要内容,“琴、棋、书、画、诗、酒、花、茶”是文人所谓八大雅事,围棋是所有这些项目中直觉理性最专门化的一种,专心也就是一种人性的基本修炼,围棋专注于理性的直觉,对于学子来说,“一心以为有鸿鹄将至”是入不了门的,但真正的修炼是对棋局的直觉理解,这是一种无言表达、基于文化的质朴理性。 相对而言,机器无所谓文化,所以也无所谓直觉。作为人工智能的智能代理(Agent)不同于算法的机器(图灵机)在于后者的输入是数值数字,而下围棋的机器如AlphaGo输入的是已经具有结构性的数据集(棋谱),即使是AlphaGo Zero也是研究人员赋予了算法的先天性,如果不学习人类的经验,研究人员不继承以前的成果是无法得到AlphaGo系列的成功的。 机器能够战胜人是围棋技术上的胜利,机器不会受到感情、情绪、现场气氛的影响,因此对于机器来说,谈不上“棋艺”。人的本质是文化的人,人能够艺术地使用技术,艺术家对人生和社会的态度、理解、和认识成为艺术品中的理性因素,虽称“艺术”并非匠艺的“技术”而是美和审美的艺术。艺术也是艺术家、批评家和观众之间的交流和相互理解,对于机器而言,只有棋盘和棋子之间的复杂关系,不会具有人性和文化的因素。机器在技术上胜过人并不奇怪,人使用工具就是因为工具是对人的技术能力的替代,对机器胜过人的担忧或恐惧并不来自机器与人在力量或思维这样的能力上强大于人,而在于迄今为止我们对于机器与人在本质上究竟有什么不同的认识和理解上并未形成共识。 “人只不过是大自然中最脆弱的芦苇,但他是会思想的芦苇”,帕斯卡尔的骄傲并未过时,机器没有人这种既是最脆弱的同时又是最强大的这个本质性。 “艺术”通常是指艺术形象的创造,但围棋的棋艺并不创造一种具象的形象,围棋的局面是一种简单形式中的抽象的形象,围棋是抽象的局面的创造,因此与直觉的审美和情感不同,棋艺要求基于几何性的一种直觉的超层次的理解和创造,这种创造性又是在双方对抗性的个性与共性中进行的,所以围棋对局不仅是技术的较量,更是从感受到对方的气质,性格,修养的内在性的无言沟通,所以围棋的棋艺是一种抽象形象的共同创造和互动中的内在交流。 日本的围棋文化重视棋艺中的礼仪(艺、品、理、规、礼),对棋具和相关的小道也非常用心,围棋与花道、茶道等一样,成为了一个非常精细的文化生活体系,体现了日本文化的特质。 围棋界普遍承认,围棋棋手的人品也就是人的棋品,这是指棋手的修养与棋术的关系,人们普遍地把棋赛的临场心态,对战略思想、战术机会的把握等作为高级棋术素质,都是以棋为人,称之为“棋道”,实际上,棋艺建立在人品之上,真正的棋道是人道,是中国文化和中国学术理性的一种无穷境界:“弈之为道,数叶天垣,理参河洛、阴阳之体用,奇正之经权,无不寓焉。是以变化无穷,古今各异,非心与天游、神与物会者,未易臻其至也。”(清,施定庵,弈理指归,序) 中国传统文化中文人的纯文化生活能够将世俗人生消融在理性的超越之中,琴棋书画、诗词歌赋创造的境界是实在世界的超越,这与中国围棋的直觉纯粹和超越性具有一种共同的理性美感,所以中国文人以诗言志的本能在以围棋为诗的表达中能得到一种越界的融和: 黄梅时节家家雨, 青草池塘处处蛙,有约不来过夜半, 闲敲棋子落灯花。(赵秀师,约客)——棋为人境,相约相忘。 山僧对棋坐,局上竹阴清,映竹无人见,时闻下子声。(白居易,池上二绝)——人在局中,又在局外。 玉子纹楸一路饶,最宜檐雨竹萧萧。羸形暗去春泉长,拔势横来野火烧。守道还如周柱史,鏖兵不羡霍嫖姚。浮生七十更万日,与子期于局上销。(杜牧,送国棋王逢)——人、棋相喻是棋艺,人、棋同境是棋道。 闲看数招烂樵柯,涧草山花一刹那,五百年来棋一局,仙家岁月也无多。(徐文长,题王质烂柯图)——棋局也是历史剧,中国本土文化特色的人、仙同质,是中国传统文人的最后的精神寄托。 五、结语 当我们迷惑于机器是否会有感情、意识时,不妨首先去体会、研究一下,作为文化的“人”的实质是什么?这有助于我们走出人工智能给我们带来的忧思。 本文相关内容和参考资料除已有文内夹注外,可参见周剑铭、柳渝:中国文化和中国思想;中、西文化和科学、人文两种“两种文化”的交汇;算法、不确定性和不确定性问题(NP)理论;智能哲学等网上系列文章。[详情]
GoogleDeepMind研究科学家、《星际争霸》AI计划负责人OriolVinyals将在EmTechChina全球新兴科技峰会(2018年1月28-30日[详情]
今年5月在乌镇大战谷歌人工智能AlphaGo惨遭三连败的世界围棋职业九段棋手柯洁8日再次现身乌镇,出席2017首届智能金融知识图谱论坛。这一次,他是为人工智能站台。 他在现场表示,未来是属于人工智能的,自己再与人工智能对抗是没有任何意义的。 他说,围棋界是崇拜强者的,自己输给AlphaGo有幸和不幸,不幸是遇到了无法超越的对手,而幸运的是作为棋手,有幸见到了真正无敌的存在。 未来,在围棋之外,他也希望能往金融或教育领域进行探索尝试,比如将人工智能应用到围棋教育上。 “结果不出意外的,我成为了人工智能的垫脚石。” 他本人也很感慨,很多围棋圈外的人知道自己可能并不是因为围棋,而可能是因为AlphaGo,因为人工智能。“对于我而言,人工智能始终是一个避不开,必须面对的话题。” 时隔半年,他已经成为人工智能的“推崇者”,他在多个场合表态“未来是属于人工智能的。”。 他说,围棋界的人应该说是最早与人工智能接触的一批人类,未来90%的行业都可能遭遇人工智能的冲击,围棋界正好先接触,迷茫之后,会发现人类有自身价值,情感是机器无法代替的。比如机器人也可以给人送咖啡,但总归没有人类的亲切与和平相处的感觉。 而对最近刚刚拿到沙特公民身份,成为历史上首位机器人公民的Sophie,柯洁坦言还是觉得有些恐怖。 今后,柯洁是否还要在围棋上继续大战人工智能? 他表示,以自己现在的状态,无论怎么努力,这一辈子都不可能赢AlphaGo。因为它的棋远远超出了我们的想象,超出了我们所认知的境界。 “如果是大家真的很喜欢看我被虐的话,我会义无反顾地去对战;如果有一天,科技已经能让我植入芯片,我也会义不容辞的植入芯片,我也会去报仇。” 现在看来,柯洁对未来的规划似乎与人工智能挂上了点钩。“人工智能在未来绝对是不可限量的,潜力也都是无限的。” 他说,棋手可以通过AlphaGo行棋的思路从中获益。传统印象中下出一些理所当然的棋,在人工智能的眼中都是错误的。它有一条更简洁、更快捷、更有效的方法颠覆传统的下法和认知。 通过学习,人类的棋艺也会比过去更强大一些,理论也会比过去更先进。人工智能也可以对人类棋手下的每一步棋做估值评分,可以对每一步棋打分。 “说职业棋手苦中作乐也好,一种全新的观赏方式也好,这也是之前没有想到AI带来的好处。学围棋的人越来越多,非常感谢AlphaGo为围棋带来这么好的宣传,也感谢人工智能。” “我只会下一点围棋罢了,能够改变生活,改变未来的是这些非常强的人工智能。” 贵为世界排名第一的棋手,他一直提的是人工智能大数据如何改变了人们的出行方式。他相信,在其它行业,比如教育行业,人工智能会带来非常大的改变。 他表示,自己在围棋之外,也想在工作闲暇之余多做一些推广,和更多跨界的人士交流。“我可能会关注金融、教育行业,这都是我可以去跨界,多开拓自己的思路,我觉得这也是未来的一个方向。” (本文作者:赵小燕)[详情]
来源:弈客围棋 作者:侯靖哲、何旸团队 本局摘自AlphaGo Zero VS AlphaGo Master 第14局。(master执白) 进行至第17手是双方出现率最高的布局 右上定型大致两分,其中白28有反击的手段—— 白1.3是最容易想到的反击手段,如果黑4强吃白棋,将被白棋简明击溃。 白1如果简单地长一个,黑2先手立完尖在4位,黑棋好调。 白2.4扳粘,黑5尖顶只此一手,白6.8简明处理,由于左边白棋太厚、右上黑四子略显凝重,黑战斗不利。 白2.4最强抵抗,黑5.7必然,白8先夹一下破坏眼位,黑13扳住强硬!白14扳被黑15妙手一断!白动弹不得。 35至45是比较正常的进行。 这样虽然是正常的定式,但在这个场合黑A.B二子太过重复,黑明显不好。 白58神来之笔!60是连贯的好手! 黑1若粘,白2简单飞一个,之前的交换明显得利。 黑1若还是尖出,白2压住,黑3.5扳断,白6打吃黑已无法连回黑1一子,这样就可以看出白58的巧妙之处! 弈至64白调子不错。 黑65打入好点!白76.80意在攻击黑棋左边几子,黑91.93整形好手,94~102这几步棋体现了AI对局面的掌控能力 黑139寻求眼位,白140灭眼,黑141以下形成劫争, 弈至174形成大转换,可谓是沧海变桑田!白成功确立优势。 黑197殊死一搏! 但无奈白198以下计算精准,黑大龙被杀已无力回天。 [详情]
来源:弈客围棋 作者:白石勇一 翻译:王振飞 继续介绍AlphaGo Lee对Zero的第6局。 1图(实战) Lee执黑先行。 下至白△,与第3局的布局完全一致。 第3局时,双方选择了黑A白B的顺序来下。 黑△是棋筋,通常这里总是要补的。 然而…… 2图(实战) Lee黑1居然脱先了!! 白2断,黑棋外势崩溃。白4之后,将来还留有A位枷的手段。 一般都认为黑棋这样是不可取的。但执黑的Lee继续黑5点三三攻击白角。 我的理解是:Lee认为右上角白棋反正已经活了,继续在这里下,也只不过是继续扩大实地而已。所以此时抢占别处非常重要!虽然这么说,但老实讲,Lee君,我还是觉得右上角不能脱先啊!! 在AlphaGo的系列软件中,Lee的棋谱,其实我们之前只见过8盘棋(译者注释:与李世石人机大战5盘,自我对弈3盘,每步5秒),所以我们直到现在为止方才知道Lee下棋时的全面表现。 但是既然Lee这么下,也就说明之前人类认为这里无论如何是一定要补的,未必就是正确。 那么点三三之后,白棋通常有B,C,D三种应法。那么Zero会怎么选呢? 3图(实战) Zero一种都不选,直接1,3吃掉黑点三三一子,粗俗有力。下法非常实战化。 4图(实战) 黑1,5拔花。棋形很厚。 这里我们注意一个细节——黑△一子的位置有点美中不足。考虑到厚薄关系,此时黑△一子明显摆在A位更加理想。这也为之后白棋的打入埋下了契机。 感想:Lee在面对Zero时,感觉策略有些不足,只会一味硬怼是不行的呀。[详情]
作者:王丹蕾 陈庚 吴婉瑜 央广网厦门11月5日消息(记者陈庚 吴婉瑜)第十届海峡两岸(厦门)文化产业博览交易会海峡两岸围棋与人工智能邀请赛于11月3-6日在厦门举行,围棋界和人工智能围棋大咖云集,共襄盛举。本次围棋和人工智能邀请赛有聂卫平、马晓春、王立诚、罗洗河、林至涵等棋界大咖助阵,也有来自世界排名第二的CGI和第四的天壤等围棋人工智能机器前来参战。4日举行的聂卫平携手天壤人工智能机器对战王立诚及其携手的CGI人工智能机器战队共进行了237手棋,王立诚、CGI中盘战胜聂卫平、天壤人机组合。 本届比赛有别于以往的围棋比赛,11月4日,聂卫平携手天壤人工智能机器对战王立诚及其携手的CGI人工智能机器战队。11月5日举行两岸大学生人机队际赛及世界冠军人机对战赛。世界冠军人机对战赛由世界冠军马晓春九段迎战台湾CGI人工智能机器,同时世界冠军王立诚九段也将与大陆人工智能机器天壤对阵。 薛贵荣:人工智能在“自我学习” “四位的人机配对赛有很大的不确定性,棋风都不一样,比赛的时候如果思路比较一致就下得比较流畅,如果思路不同的话下起来就比较麻烦。”天壤创始人及CEO薛贵荣介绍道。来自上海的天壤是人工智能的新星,公司成立仅一年多,在人工智能围棋领域突飞猛进,首届世界智能围棋赛中多次屠龙被冠以“死活达人”称号,最终杀入四强。“以前比赛我们只需要考虑两台机器,这次是我们第一次人机配对赛。我们也在探索,将来比赛中,应该是以谁为主的,比如说以人为主还是以机器为主,像今天的聂老师、王老师都是有棋风,之后机器怎么调整。”薛贵荣表示,人工智能也像人一样需要通过不断实战来“自我学习”,通过对抗来总结和改进。“我们的人工智能每天要生产几十万盘的棋局,数据大了之后,从中学习棋局的特征。这场活动可以帮我们收集变数增加的情况下的数据。人工智能进步很重要,人机协作在一段时间内也非常重要,我们接下来会关注人机协作时有差异的话应该怎么发展。” 林至涵:人机配对赛能吸引更多围棋爱好者加入 5日,在厦门机电设备展示交易中心将举行两岸大学生人机队际赛。台湾参赛队伍由林至涵担任主教练,带领CGI人工智能机器和4名台湾大学生与大陆参赛队伍对技。林至涵来自台湾棋院,是台湾四大九段之一。“我们已经知道人类与人工智能对抗时候的弱势,那今天的活动这种人机搭档的方式很好,以前的围棋世界赛里就有类似的两人协作的,现在把其中一个人换做机器。”林至涵认为,围棋有两个发展层面,一个是追求自己的围棋造诣,一个是推广。“人类一直都在追求自己越来越强。但在人工智能面前突然发现人类下不赢人工智能。我们需要找一个方式再去推广,让大家觉得围棋是个好玩的东西。围棋很难,大家要多认识才能产生兴趣,透过人机配对赛的方式可以吸引更多围棋爱好者加入。” 叶彧熏:我们是一群热爱围棋的科技人 “原本我们网络下棋只能看到冷冰冰的棋子和打字,但是透过我们的平台可以直播、对话、打赏,还可以通过AI和世界冠军对弈,促进人面对面对弈的形式。”90年的叶彧熏来自台北,是围棋业余七段棋手,如今,他与一群围棋爱好者共同创办了围棋人科技股份有限公司。叶彧熏小时候在北京围棋机构训练了两年,大学又在厦大做了半年的交换学生,叶彧熏熟悉两岸围棋文化,看到今天的两岸围棋与人工智能邀请赛感到很兴奋。“这次活动很盛大,大陆在围棋产业的促进推广上很下大气力。我们是一群热爱围棋的科技人,我们公司致力于成为全球性的围棋网络平台,希望多一些大陆的棋友来交流。未来会继续寻找两岸创业合作的机会。”[详情]
中国古人下棋,无论输多赢少,都是要走到最后数下子的。在自身棋力的基础上,追求最好的结果,这是锤炼智慧和磨砺心性的一种方式。正因如此,围棋才被归到琴棋书画“四艺”之中,成为修身养性的道。然而近代围棋受日本和韩国的影响,围棋在竞技的道路上走得太远,胜负被看得太重了,直到人工智能的横空出世,才敲醒了正在“装睡”的围棋界。 为了竞技,围棋比赛的时间越来越短,惊心动魄的逆转虽然多了,却少了那种轰然天成的美感;关于贴目的分歧导致世界上到现在都没有一套统一的围棋比赛规则; 职业棋手们的棋力越高,却越离社会越来越远…… 不久前柯洁说 能够遇到AlphaGo是棋手们的幸运 未来若干年后,站在一个历史的高度,看我们这段时间的围棋发展的话,恐怕会是条曲曲折折的路线。好在AlphaGo出现了,它不仅带来了围棋技术上的革新,更给整个围棋行业的发展前路扫清了雾霾。 在新的时代,围棋赛制要怎么改变,围棋明星要如何定位,围棋与文化要怎样融合,在大时代变迁的关头围棋行业究竟面临着什么,这些都值得仔细思考。有幸的是,参加第二届商界棋王赛的八位棋王,从围棋爱好者和商界精英双重视角给了我们很有价值的分享。 围棋赛制新论 关于贴目贴多少的争论,围棋界就一直没停过。其实沿用中国古人的做法,可以有一种非常公平的比赛方式,那就是两人对阵,黑白各下一局,两局比总子数。这种比赛方式是乐工场董事长杨乐涛提出来的。这种算子的比赛模式在高尔夫围棋比赛中也得到了测试,很有合理性。 这样的比赛会出现势均力敌的和棋,但概率依旧非常低;铤而走险的不合理下法也要考虑承担更差的后果;两盘棋子数一起计算,胜负的博弈变得更加微妙;最关键的是公平。 乐工场董事长 杨乐涛 在发起人聂卫平的建议下,本届商界棋王赛采用了人机结合的赛制。棋手在比赛中有两次向人工智能求助的机会,由人工智能提供下法,辅助人类来做决策。金立集团董事长刘立荣认为这项赛制是个创举,而且非常有趣,令比赛增加了更多的变数。比赛的过程中也印证了这一点,刘立荣有着业余6段左右的实力,但在人工智能的参谋下,虽然次数有限,但发挥出接近职业水准的实力。 金立集团董事长刘立荣 不久前在东盟国际围棋邀请赛的论坛上,林建超将军说:“无论人工智能的围棋水平变得多强,也改变不了人类才是围棋活动主体的事实。改变规则是我们最大的武器。”未来的围棋比赛方式会变得多种多样,人们在其中体会到快乐才是最关键的因素。 围棋需要明星 “如果有再来一次的机会的话,我们可能不会让柯洁学围棋,就让他练他喜欢的舞蹈,正常的读书上学,慢慢成长,过普通的人生。”柯国凡说。胜负的世界已经如此残酷,柯洁还要肩负着整个围棋的推广,对这样一个20岁的少年来说,胜利和光鲜背后的付出,只有身边的人才知道。 特邀参赛嘉宾 柯国凡 从另外一种意义上讲,柯洁似乎又是为了这个时代而生的。柯洁从围甲连胜开始暂露头角,到雄踞世界第一的位置,再到人机大战的豪情,也才不过三年而已。而发生在柯洁身上的事情,已经可以拍好几部电影了。柯洁也以惊人的速度成长着,不仅是棋艺,更多的是为人处世的练达。 济南明仁置业董事长 周天乐 30年前,很多人因为聂卫平在擂台赛上神勇而接触围棋,成为棋迷;30年后,因为柯洁和AlphaGo他们又重新回到棋盘前,找到了当年的热情。济南明仁置业董事长周天乐就是这样。“柯洁其实已经成为一个品牌了,不仅限于围棋界,在全社会范围内都已经得到了认可。”周天乐与柯国凡是好朋友,经常会为柯洁提一些建议:“这些年柯洁最重要的事情当然是比赛下棋,但也应该有个长远的发展规划,甚至对接一些真正专业的经济团队。” 其实,需要包装和规划的又何止柯洁一个棋手,整个围棋行业都需要全方位的提升内涵和形象设计。 围棋与文化的融合 女子围甲联赛是中国棋界一项非常独特的风景线,虽然女子围棋的竞技水平还远不如男子,但这项比赛所引发的关注尤其是在围棋圈外的影响力非常惊人,各地分站赛主办的规格都非常之高。公益围棋教室捐赠、棋迷多面打指导棋更是让高高在上的职业比赛,有个更多贴近普通人的机会。 中信置业董事长 胡东海 中信置业从女子围甲联赛之初就一直鼎力支持,董事长胡东海只要时间允许,女子围甲的活动都会义不容辞的出场站台。明年女子围甲联赛的主题是 “扶贫”,到偏远不发达地区,帮助人们“启智”,胡东海表示要加大投入:“这是我们中信集团的社会责任。” 中信置业河南总经理 章广跃 同样与女子围甲有着千丝万缕联系的是中信置业河南总经理章广跃,女子围甲河南队一直是他在背后支撑,洛阳的很多围棋活动也有着他的支持。章广跃对围棋文化情有独钟,在他的全力以赴和中信集团的坚强后盾下,中国第一个围棋小镇将在洛阳正式启动了。这可能将是中国围棋行业发展历史上,堪比首个世界大赛创立的壮举。 整个时代面临的变革 华奥星空董事长 王平 王平作为华奥星空的董事长,看到的不局限于围棋,整个体育行业都面临着大时代的变革。一方面是中国正处在高速发展的阶段,体育产业正面临着与全社会接轨的关键时期,是提升人们幸福指数的关键一环,围棋也有着属于自己的机会。另一方面,人工智能的出现让体育行业以前很多不敢想象的设想和服务都成为了可能,还是以围棋为例,人工智能辅助工具就能大大缓解现有的围棋培训行业师资短缺的瓶颈。 信柏科技创始人 柏林森 柏林森创立的信柏科技最开始做的就是大数据领域的应用,随着人工智能技术的成熟,他的团队已经开始在金融和医疗领域拓展实际应用的场景。柏林森最大的爱好是看DeepMind的各种论文,他说人工智能代表着这个时代的先进生产力,我们要想办法离它近一点,在大变革到来的时候才能不被淘汰。 (周游)[详情]
来源:围棋编辑部博客 原址:https://book.mynavi.jp/igo/blog/detail/id=87113 大家好。我是编辑部的山本,现在很希望家里能有个被炉。 今天来介绍一款软件。锵锵! 天顶围棋7 ZEN 这一版本的ZEN最高棋力达到了职业九段! 发售前我们请了职业棋手与其以分先进行对局,据说ZEN能与职业棋手势均力敌,还赢了几盘。 当然,对局时的性能也很重要,但最能帮助使用者增长棋力的还要数研讨功能了。 棋手中首屈一指的围棋AI研究家大桥拓文老师对ZEN做了以下评论: 让大家翘首以盼的天顶围棋7终于发售了。 无愧于此前流传的高评价,天顶围棋7的确是有职业水平,有时会下出连我都觉得伤脑筋的严厉招法。 我在和它玩时也发现了许多有意思的使用方法。 我想大家肯定都各自有拿手的作战策略、喜欢的布局。如果你想进一步完善自己的策略、布局的话,这时就该轮到天顶围棋7华丽登场了。摆出自己拿手的布局,点一下右上的研讨按钮试试吧。它会为你提供若干十分有力的下一步的候选,还会显示这些候选点的评估值(即胜率)与搜索次数。虽然大家一般都会比较在意评估值,但模拟次数也十分重要。搜索次数越多,评估值也就越准确。同时参照着这两项参数来思索、制定策略是件十分有意思的事。 评估值是以胜率来表示的,我想有人可能不太习惯,所以在此简单介绍一下(天顶围棋7所表示的)胜率的基准。 显示50的话也就是50%,自然就是双方不相上下的局面。60%是略好。70%是优势。80%的话可以说胜利就在眼前了。差不多就是这样。但要注意一点,即使只领先1目半左右,到终盘时也有可能会显示胜率为90%。90%给人感觉差距很大,但1目半对人类而言只是很小的差距。了解这一点,有助于更好地使用天顶围棋7的研讨功能。 至于序盘,评估值在40%~60%之间时可以理解为某一方只有极小的优势。而双方不相上下时胜率则会在45%~55%的范围之间波动。 为了研究序盘下法,我也开始使用天顶围棋7了。它给出了好多特别有意思的下法,我感觉我一时半会儿是放不下电脑了。 ——大桥拓文。 研讨画面示意图如下: ZEN7研讨画面 红框框起来的部分显示有“候选点”、“搜索次数”、“评估值”。 天顶围棋7显示的这些参数都非常准确,甚至连职业棋手都能从中学到很多。如果好好利用,想必棋力能够大幅提高吧。 购买地址:https://book.mynavi.jp/ec/products/detail/id=77803 英文版:https://book.mynavi.jp/ec/products/detail/id=79528 天顶围棋主题网站:https://book.mynavi.jp/tencho7/ 今后还想写一些关于天顶围棋7的推荐使用方法一类的文章。 那么还请大家多多支持天顶围棋了! 天顶围棋作者加藤英树 (朱东冬)[详情]
晚上好各位,11.15深圳大学围棋节拉开序幕,晚上有聂老和诸位名手的座谈会,吸引了诸多学子到场。封面为女子世界冠军徐莹老师隆重介绍聂老。 场面十分热烈 现场嘉宾包括世界冠军、聂老弟子常昊老师 深大学子世界冠军唐韦星 深大学子世界冠军周睿羊 擂台赛当然是聂老座谈会不能略过的话题,聂老:我赢了大竹英雄以后,邓小平亲自给我家里打了电话,但是那时候我还没回去呢。 聂老:我上场前坚信我能赢小林光一 徐莹老师:您为什么这么坚信啊 聂老:凭实力啊! 聂老:我赛前研究了很多小林光一的棋谱,发现他的对角胜率要比一边的低,所以我和他那盘选择了对角 聂老:听说当年财政部要降低围棋的伙食标准,我说这不行啊,就给总书记打了个电话,总书记说,谁敢降低你们的伙食?我说财政部,总书记说,谁敢降低你们的伙食,给我降低财政部的伙食。 随后聂老和学子们分享了对AI围棋的一些心得 聂老:李世石和AlphaGo第五盘,当时角上一个局部,大部分职业棋手都觉得李世石好,或者好不少,我当时觉得AlphaGo略好,后来看AlphaGo要好的多 嘉宾一览[详情]
2016年的年初,柯洁和李世石完成了经典的五番棋对决。坐在棋盘一端的,是统治围棋世界过去十年的王者,另一端的,是如狂风呼啸,席卷棋坛的天才少年。这样的场景,曾经在十多年前发生过,那时候的李世石,还是有着青涩笑颜的,刚从飞禽岛走出的不败棋客,而当他带着一身少年意气,坐在了李昌镐的对面,我们都知道,围棋世界,将要翻开新的篇章。 少年子弟江湖老,旧日的少年成了今日的王者,而今日的王者也将面对新的少年。围棋世界的代际交替,像是春秋迭换里注定绽放的花朵与注定凋零的秋叶,是造物写就人力难敌的残忍与动人。决赛前,柯洁说,“李世石之前说他有五成希望取胜,我想如果一共是一百成的话,他有五成。另外我想说,传奇是时候落幕了”。围棋世界里,已经有多漫长的岁月,没有听到过这般裹挟着万千少年气天才气的话语了? 上一句,大概正是当年李世石对着李昌镐说出的,“在所有高手中,昌镐的力量应该是最差的”。十三年流光电逝,如果李世石想得起当年旧事,大概也会笑这岁月写就的剧本。更有趣的,是当年李昌镐和李世石,如今的李世石和柯洁,五番棋对决的结果,都是3:2。唯一的不同,只是这一次,更年轻的那个人赢了。 对于李世石而言,这是悬崖边上的战斗。他已经过了而立的年岁,在更新换代越来越快的围棋世界里,他只能一直赢下去,一旦他输掉,“李世石老了”的舆论,就会像潮水一样涌来,将他瘦削的身形淹没。此前,哪怕他立于围棋世界绝巅的时候,他也像是一只遗世独立睥睨天下的狼王,和他一生的好朋友好对手古力相比,他更敏感纤弱,却也更凌厉狂傲。他刚出道的时候,《围棋天地》做了一期专题,题目简简单单,“世石如豹”。十年匆匆,当我们在世界大赛里一次又一次的看见李世石的身影,当他做出的一件又一件事情惹得我们惊叹不已,我们或许才能真正看出他的真正样子—他从来,都是狼王。 而如今,这只站在围棋世界最高处的狼王,已经老了。可是,守在自己领地上的老狼王,大概,才是最让人恐惧的事物。 2015年全年执白不败的柯洁,在年末的五番棋第一局,终于破了不败金身。李世石厚重稳健的棋风收到了效果,在对手棋风的突然转变面前,柯洁仿佛并没有准备好,他对中后盘的判断始终太过于乐观,而当发觉不妙时,已经为时太晚。这是2015年12月30日,柯洁这一年的白棋战绩,也终究定格成了34胜1负,白壁微瑕,终有遗憾,却也是对于这位新科世界王者的提醒,因为不圆满,所以在新的年份里,才有更多的进步可能。 这是老狼王的回应,是面对侵入自己领地的年轻人,最直接最决绝的回答。想要王座,那就用撕咬,用战斗,用血和泪,亲手拿过去。 决赛第四局,柯洁不敌李世石 第二盘,开盘未久,柯洁便出现了误算,黑棋长考后下出101、103两手粘,被李世石脱先分断,将右侧黑棋直接歼灭,研究室里的聂卫平棋圣留下一句“败局已定”便离开研究室,对于所有人而言,仿佛0:2的结局已然注定,柯洁这一次向着王座的冲击,也终将蒙上一层太深重的阴影。所有人都这样想,除了正在下棋的柯洁自己。从网棋世界的摸爬滚打里,从围甲难求一胜的境遇里走出的“潜伏”大帝,从不会轻易将“失败”当成理所当然。而柯洁的坚持也终于等到了奇迹的诞生,进入读秒阶段之后,李世石连续出现失误,柯洁用屠龙的方式,完成了死里逃生的神奇逆转,也让胜利的天平,再度回到了双方均衡的位置上。 第三盘,李世石再度早早进入读秒,也再一次在读秒阶段输的溃不成军,然后,在李世石两盘误算之后,柯洁用第四盘149、153两手致命败着当做回应。这是战斗,是新老王者们为了权杖,也为了他们身后代表的国家棋运的殊死搏杀,“争棋无名局”,这样的对局,是拳拳到肉,是剑影漫天,我们看得到柯洁和李世石所有的情绪,那些欢喜与黯然,都在脸上写的明明白白。因为太重要,因为太渴盼,所以才会在这样的对阵里,留下不那么精彩的棋谱,毕竟,哪怕天才超卓如他们,也终究,是有血有肉有喜有泪的,活生生的人。 而围棋,也正是在这样的战斗里,才拥有了让我们心驰神迷的魅力。那些失误与突然死亡,那些奇迹与惊天逆转,那些执子的手与对视的眼眸,那些一直鲜活的可能性,他们留下棋谱,留下故事,让我们依旧此时此刻依旧感知得到他们当年的紧张与焦灼,身下万丈绝顶,身前璀璨群星。 柯洁夺得梦百合杯 柯洁夺得第二届梦百合杯冠军 2:2,决胜局,一战决胜败。没有比这更传奇的剧本,而这传奇的一战,也终于用传奇的方式告终。前半盘柯洁优势的情况下,却在一处打劫中不慎误算,揪着自己头发表情痛苦的柯洁,牵动了万千棋迷的内心。赛后,柯洁表示,自己一直点错目,以为自己输了,中间甚至一度要认输。还想过输了之后要“削发明志”。但看起来,围棋女神似乎比较喜欢柯洁的头型,并没有让他换造型的打算,直到最后一刻才被看清楚的胜负,以黑棋粘劫收后,半目胜利而告终。这是中国特有的规则,胜的惊险,胜的艰难,但归根结底,少年走出了那一步。他从前辈手里,接过围棋世界王者的权杖,一年三冠,海阔天空。 在那一刻,我们看着领奖台上意气风发的天才少年。那是中国围棋的荣耀,他已经成为了中国围棋漫长历史上,古力、常昊、孔杰后的第三位三冠王,他已经走在了李昌镐李世石曹薰铉们曾经走过的,独属于大棋士的传奇道路上。 如果,一切外力都未曾发生,此后的围棋世界,大概将会流淌的波澜不惊。像是曾经发生过的,新王者接过老王者的权杖,于是战国时代,终究又归成一人独尊,围棋世界,也依旧会按照自己的逻辑,安宁又缓慢的运行。但是,2016年3月,当在那个凛冽初春里,李世石和人工智能相遇的时候,我们早已预想的那个未来,却仿佛被蝴蝶扇了一下翅膀,从此,整个围棋世界,地覆天翻。 和李世石决战之前,AlphaGo最好的战绩,是击败了职业棋手,欧洲冠军樊麾。但是,欧洲冠军和世界冠军的差距,让所有职业棋手都依然相信李世石能够轻松获得胜利。在人们眼里,这项世界上最难的智力游戏,还远远没有到被人工智能轻易击败的时分。崔丙圭九段说,“计算机向人类顶尖棋手挑战,怎么说也得先摆上两三子吧?计算机程序战胜人类,时机还是尚早”,李世石自己也说,要争取“不让电脑赢到两盘”。 但是,当在首尔四季酒店沸沸扬扬的记者人群里,当在全世界的镁光灯下,我们看着棋局走向一个我们想不到的结尾,那是历史性的时刻,人类冠军终究在人工智能面前败下阵来,而且,一败就是三场。从遗憾到绝望,从震惊到麻木,我们仿佛已经在接受这样一个事实,人工智能已经确确实实的在围棋领域超过了人类高手,我们在曾经引以为傲的,不可能被电脑攻克的领域,溃不成军。 人机大战 而也正因为如此,我们才如此珍视李世石在第四局中的这一胜,我们也都知道,在这一胜之后,下一场胜利,已经不知道会在何年何月,甚至,不知道它还会不会到来。78一手挖,这是如鬼似神般的一击,过去十年里人类棋坛无敌的王者,在最需要他站出来的当口,用他瘦削的身形,给围棋世界,也给所有关注着人机大战的人们留下一个永远闪耀着的背影。新浪从首尔发回的新闻,最后是沉甸甸的几个字,“李世石,谢谢你”。 人机大战第四局李世石改变历史的一胜 我们希望李世石失败了太久,而这一次,当我们终于希望他不要失败的时候,他没有让我们失望。 “三连败后终于一胜,此刻的喜悦真是难以形容,这一胜太有价值,我不会用任何东西来换”。颤抖的嗓音和如释重负的神情里,我们见到的,是我们从来没有认识过的那个李世石。有报道说,在连续输掉三局之后,李世石在路上只要见到围棋相关的人就会连续说“对不起”,李世石的夫人说,晚上偶尔睡醒,就能看到李世石在凉台上对着棋盘叹气。一生意气纵横,一生不弱于人,那一刻李世石的心绪,也许只有未来一年的柯洁能感同身受。我们都知道,这一次,李世石是真的发了狠,要把整个人类的胜负,扛在自己肩上。 神雕侠侣里,杨过问郭靖,“郭伯伯,你说襄阳守得住么”,郭靖沉吟良久,手指西方郁郁葱葱的丘陵树木,说道,“襄阳古往今来最了不起的人物,当然是诸葛亮。此去以西二十里的隆中,便是诸葛亮当年耕田隐居的地方。诸葛亮治国安民的才略,我们粗人也懂不了,他曾说只知道“鞠躬尽瘁,死而后已”,至于最后成功失败,他也看不透了”。我与你郭伯母谈论襄阳守得住守不住,到最后,也总只是“鞠躬尽瘁,死而后已”这八个字。 襄阳终究是守不住的。才气卓绝如李世石,当然也知道,他所坚守的阵地,总会被人工智能攻克。但他依然奋力搏杀到了最后,正是因为这一胜,我们才等来了第二年里,人工智能和人类王者的又一次交锋,我们才能在失败面前,依旧骄傲的讲出,我们要向人类“脱帽致敬”。 但是,这一切,却终究只是在命运写好的轨迹里,以个人的风华绝代,带来的那么一点微小的改变。1:4和0:5,太不一样,却同样是人类的败北,我们都已经明白,人工智能只会将人类越抛越远。2016年年末,当Master在野狐和奕城横扫人类高手完成六十连胜,当一位位人类棋手决绝的冲向人工智能,却收获一次又一次失败的棋局,一切的结果,其实早在柯洁和AlphaGo的江南决战之前,就已经板上钉钉。 围棋世界的浩荡长河,在命运的重重一击下,刹那间变了走向,翻卷着无数身处在这个变革时代的小小浪花,走向了茫然不可知的星辰大海。浪花们愿意按照原有的轨迹流淌,还是像如今这般,毅然决然的冲上礁石、冲向未知、冲向我们称之为“道”的渺远未来?个人的命运在宏大的时代叙事之前,显得微小又虚无。即便他们,是这项人类最难的智力游戏中最卓绝的天才,但终究,也只是这个伟大时代里,充盈着喜怒哀乐的,同样看不清自己前路走向的小小的“人”。 你看着他们,用坚忍不拔的勇气和永不放弃的决心,飞蛾扑火一样的,冲向注定将远远把他们抛在身后的人工智能,以对天拔剑的勇气,收获早已注定的败局,求仁得仁,求义得义,他们在变革的时代里用自己落下的每一颗棋子堂堂正正硬硬朗朗的写下“棋士”两个传承千年的名字,但是,一生争胜从不言败的他们,却终究因为失败,而被史笔记下,被更多的人记住。 多喜悦,多悲哀。 当然,这还不是最后的时刻,在来年的五月,在江南水乡青砖白瓦,人类新王和人工智能,还会完成让世人瞩目的番棋较量,但是,那,已经是这绵延了太久的,属于“人机大战”这个意蕴万千的名词的,一个意味深长的终结符。 在开年的时候,在柯洁和李世石对战的时候,我们不会想到这一切。我们依旧可以选择留在过去,但围棋不能,它在用比我们想象的快得多的速度前行,我们每个人都依旧微小,但这,确实已经是围棋的大时代了。 谨以此,献给刚刚过去的,变革的2016。 2016年中国围棋大事录: 2016年1月,柯洁击败李世石,获得梦百合杯冠军 2016年10月,唐韦星击败朴廷桓,获得应氏杯冠军 2016年11月,党毅飞、周睿羊会师LG杯决赛 2016年12月,陈耀烨击败柯洁,获得百灵杯冠军 2016年12月,柯洁击败柁嘉熹,获得三星杯冠军 2016年年末,范廷钰在应氏杯完成七连胜 (未完待续) (谢天舒)[详情]
来源:柳渝的博客 作者:柳渝。 摘要:继AlphaGo完胜人类棋手后,AlphaGo Zero完胜AlphaGo Master,恰恰表明了作为人工智能的围棋机器的技术性本质。中国古围棋在日本的职业化也是围棋的技术化,这是今日围棋机器完胜人类的必然。中国围棋的文化本质蕴含于棋艺和棋道之中。围棋的棋理只有在科学与人文和中、西文化的交叉视域中才能得到真正的阐释。 目录 一,AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予 二,围棋盘棋上的棋理 三,围棋的职业化与技术化 四,围棋的棋艺与棋道 五,结语 AlphaGo以学习人类经验棋谱而战胜了人类棋手,成为了人工智能的时代标志,而AlphaGoZero则以“白板”(tabular rasa)学习而再次成为头号新闻,英国经验主义哲学家洛克(John Locke,1632-1704)著名的“白板”说(theory of tabula rasa)认为,人出生时心灵像白板一样空白,通过人的经验心灵中才有了观念和知识,洛克认为经验是观念、知识的惟一来源。AlphaGo Zero的“白板”是指与人类经验棋谱相对的空棋盘,即从0开始的“学习”,但洛克的心灵“白板”是人从现实经验中认知或学习,两者的区别就在于AlphaGo Zero不需要人类的棋谱经验而是自己与自己在棋盘上对战的“经验”,这个区别的微妙之处就在于人类的经验与机器的“经验”有何本质的不同,这与AlphaGo对人类的伦理挑战不同,AlphaGo Zero的“白板”是对人类哲学问题的一个挑战,这些问题都深刻地与我们对人工智能的本质的理解和定义有关,实际上已经成为了今天我们对人的智能的基本认知理论的更新,其意义远超过AlphaGo Zero的成功。 就AlphaGo Zero的具体情况来说,本文讨论1。AlphaGo Zero的“白板”与人类的心灵“白板”有何不同?2。AlphaGo Zero自我对弈的经验与人类的经验有何本质的不同?我们可以在智能哲学的论域中研究这些问题的深刻意义。 一、AlphaGo Zero的“白板”学习与人工智能的“先天”性赋予 DeepMind团队在“自然”杂志上发表的论文,推出了人工智能围棋程序的最新版本的更强大的“学习”能力,AlphaGo Zero:Mastering the game of Go without human knowledge (无需人类知识的围棋大师),据称,AlphaGo Zero以100 : 0的成绩击败李世乭版本的AlphaGo。(http://nature.com/articles/doi:10.1038/nature24270,中文介绍可见:http://mp.weixin.qq.com/s/68GTn-BaiRPmzi9F-0sCyw)最引人注意的地方是,“我们介绍一种单独基于强化学习方法的算法,无需人类数据、人类的指导,或超越围棋规则的领域知识。AlphaGo成为了它自己的老师,”(we introduce an algorithm based solelyon reinforcement learning, without human data, guidance, or domain knowledgebeyond game rules。 AlphaGo becomes its own teacher)。 这篇论文的第一作者、AlphaGo项目负责人DeepMind的David Silver在采访中这样解释说: -AlphaGo Zero完全从“乱打”(随机)开始,不需要任何人类数据从最初原理开始而取得最高的综合棋艺水平。AlphaGo Zero最重要的理念就是它完全从无知状态开始学习,也就是从白板(tabular rasa)上开始,从自我对弈中领悟,不需要任何人类知识或人类数据,不需要任何人类经验、特征或人类的干预。它去发现如何从基本原理开始下围棋。因此白板学习对我们DeepMind的目标和雄心非常重要,因为如果你能得到白板学习,你就得到了一个代理,它可以从围棋移植到任何其它领域。你就从你所在的专业领域解放了出来,你得到了一个算法,它具有普遍性可以应用到任何地方。对于我们来说AlphaGo的意义不在于下棋战胜人类,而是去发现从事科学工作的意义,从程序的自我学习能力中了解知识是什么。我们开始发现,AlphaGo Zero不仅重新发现了人类下棋时的常用模式和开局,以及人类下在棋角上的定式,不仅是学习、发现这些而且最终放弃它们而采用自己的模式,其中有些甚至是人类不知道的或现在还没有用过的。因此我们可以说,事实上在短时间内AlphaGo Zero学到了人类上千年积累的围棋实战知识。AlphaGo Zero下棋中分析,靠自己发现更多的知识。有时候它的选择甚至超过这些,得到一些人类在这个时候尚未发现的东西,在不同的方式上发展出具有创意的新的知识点。 (AlphaGo Zero which haslearned completely from scratch, from first principles withoutusing any human data and has achieved the highest level of performance overall。 The most important idea in AlphaGo Zero isthat it learns completely tabular rasa。 That meansit starts completely from a blank slate and figuresout for itself only from self-play, without any human knowledge, without anyhuman date, without any human examples or features or intervention from humans.It discovers how to play the game of Go completely from fist principles。 Sotabular rasa learning is extremely important to our goals and ambitions at DeepMind。 And the reason is that if you can achieve tabularasa leaning, you really have an agent that can be transplanted from the gameof Go to any other domain。 You untie yourself from the specifics of the domainyou’re in and you come up with an algorithm which is so general that it can beapplied anywhere。 For us the idea of AlphaGo is not to go out and defeathumans, but actually to discover what it means to do science, and for a programto be able to lean for itself what knowledge is。 So, what we start to see wasthat AlphaGo Zero not only rediscovered the common patterns and openings thathuman tend to play, these joseki patterns that human play in the corners。 Italso leaned them, discovered them and ultimately discarded them in preferencefor its own variants which humans don’t even know about or play at the moment。 And so wecan say that really what’s happened is that in a short space of time, AlphaGo Zero has understood all of the Go knowledgethat has been accumulated by humans over thousands of years of playing。 And it’s analyzedit and started to look at it and discover much of this knowledge for itself.And sometimes it’s chosen to actually to beyond that and come up with something which thehuman hadn’t even discovered in this time period。 And developed new pieces ofknowledge which were creative and novel in many ways。 ) DeepMind强调AlphaGo Zero从白板上开始自我学习,这是指机器进入包括训练或实战状态时不从学习巨量的人类数据开始(People tend to assume that machine learning is allabout big data massive amounts of computation),但这时的AlphaGoZero本身并非白板(裸机),也并非只包含了“操作系统”的纯净机器,而是具有了强大的机器学习能力的机器,David Silver说 “但实际上我们从AlphaGo Zero中发现,算法比所谓计算或可用数据更重要,事实上我们在AlphaGo Zero上使用的计算(量)比过去在AlphaGo上要少一个数量级,这是因为我们使用了更多原则性算法。“(But actually what we saw in AlphaGoZero is that algorithms matter much more than either compute or dataavailability。 In fact in AlphaGo Zero, we use morethan an order of magnitudes less computation than we used in previous versionsof AlphaGo。 And yet it was able to perform much higher level due to using muchmore principled algorithms than we had before。)正是由于AlphaGo Zero具有这种“先天”的学习能力它才能一开始就可以自己学习自己。 DeepMind在AlphaGo Zero建造中使用了包括AlphaGo在内的很多精练的算法。因此实际情况是非常复杂的,AlphaGo Zero开始工作时并不是一台“裸机”,也不是只有操作系统的“纯净机”,而是一台“智能机”。这里不仅有传统图灵计算的算法,也有人工神经网络“代理”计算能力,即有机器本身的操作系统,也有功能计算能力和解决具体问题的功能算法或智能代理能力,这些高能力算法不是AlphaGo Zero自己学习得到的,而是人类赋予的“先天”性的人工智能,这也是AlphaGo Zero一开始就能向自己学习的原因。 二、围棋盘棋上的棋理 今年的法国科学节上,儒勒·凡尔纳公立综合大学(Université de PicardieJules Verne)第一次以科学介绍方式向公众展示中国围棋和包含其中的文化因素(亚眠“科学节”——围棋从中国到法国的旅行),在向完全不懂围棋为何物的观众简单地演示如何学下棋时,采用了两种现场教学方法。第一种是先介绍最基本的下棋规则,然后让学习者下子,这时参与者每下一子要费周折,第一粒棋子放在什么地方是很大的困惑;第二种方法是先让观众任意下子,然后在教学者的陪练中亦步亦趋地学习可行的落子方法。很明显,后者不但使事前完全不懂围棋的观众能够马上下棋,而基本上知道了什么是围棋,领会他任意落下的棋子都充满了奥秘,对围棋产生了兴趣。这个情况引发了我们进一步的思考,围棋的规则虽然简单,但与棋盘上的直接经验相比,对新手的认知、学习具有很大的区别。围棋的规则是围棋作为游戏的设计性思想的体现,而棋盘上的直接落子则是在现成的游戏世界中的经验行为,前者是人类知识的体现,而后者是作为游戏角色的经验,对于一个新手来说,后者是在棋盘上的经验中的学习。为此,我们研究作为围棋棋盘的特殊性。 围棋是在平面直交空间上的占领游戏,这对不懂围棋的人特别是西方人有一种困惑:是不是只要将棋盘上放满棋子了就可以决定胜负了?这样几乎等于没有规则,这也就没有游戏的意义了。与一般游戏规则不同,下围棋不仅是按游戏规则的“以棋行事”,而且是对弈过程中对棋盘与棋子所形成的“局面”不断地认知更新与决策,围棋的“局面”就建立在棋盘的平面直交网格的几何特殊性上。 围棋的棋盘是一种简单的平面直交网格,是平面几何空间上最基本的形式结构,围棋就是在这种最简单的直交网格上占领对弈。平面直交网格实际就是欧氏几何平面上的坐标系,在这种平面直交网格上的游戏的形成或设计实质就是对欧氏平面的基本性质甚至是潜在性质的利用和开发,中国围棋内涵的丰富性正是基于这种几何性质的深刻性。首先,在围棋中,棋盘上的直交网格的每一位置被赋予非几何的意义:空或占有、死或活、0或1,实现了几何性和数学性的人为超越结合,这是围棋棋理研究的理论基础。 以数学眼光对围棋进行过精深研究的英国数学家 John Horton Conway 发明的“生命游戏”(Game of Life)或称“元胞自动机”(Cellular Automaton)就是在直交网络上进行的一种位置格局迭代过程,每一格局的迭代由一个选定位置与其邻接位置的相互控制关系决定。这种迭代过程是算法能行的(可以程序化),但这种迭代产生的平面复杂格局可以表现为一种有规则的图形,这种事前无法预见的复杂现象就像生命现象的涌现和演化一样引人注意(注意这里有一种错觉,屏幕上生命游戏中的图案仍是由机器以算法形式产生的)。但由于平面上的位置组合是指数增长的,现有设计的可以实现的生命游戏的算法程序都无法穷尽,这种情况造成一种误解,只要有无限的空间和时间,生命游戏就可能演化出任意复杂事物,但实际上并没有进行这样的大规模研究的意义。生命游戏就是平面直交网格的几何性质表现为图案形式的算法的一个范例,但作为电子“游戏”,只能说是一种知识性的娱乐。 与“生命游戏”的图案迭代变化不同,围棋不是棋子与盘面之间的简单占领关系,围棋对网格位置的占有是对抗性的,即在直交网格上已经人为的赋予基本结构性意义的情况下,再以黑、白落子表示对抗性地占有,因此围棋的盘面是双方对抗性布子所形成的“局面”,就是说,围棋的“局面”形成既不是由程序(递归)决定的,没有如生命游戏事前的变量设定产生的算法制约性,而是不断的认知更新和决策的对抗游戏,任何“局面”不只是棋盘上的棋子与棋盘网格的占有关系,更是双方对潜在盘面的认知、信念和决策。因此弈棋不是上一局面的算法的连续迭代,而是双方棋手独自看局的直觉判断和策略的博弈,同一个盘面各人所看的局面并不相同,在双方的视野中可以有具有很不同的意义,因此围棋能体现个人的智力直觉,围棋规则简单但“易学难精”,就是对人的直觉的自然性与自觉性的超越要求。对同一个盘面双方对抗性地具有不同的理解和控制的智力竞技才是围棋表现为一种高级游戏的原因。相比于象棋等各自组织攻防战术的游戏,围棋具有更强的不完全格局和盘面全局性关系直觉与理解能力的要求。 人类围棋的高手是经历了自己的长期实战和对历史棋谱的无数揣摩而形成的,每一盘棋从落子“开局”起是在弈棋过程中个人与历史经验的综合后的再实践。而AlphaGo Zero之所以能够从白板开始(实质是“随机”开始,区别于“监督学习”喂入人类棋谱)学习,是因为它已经具有的人工赋予的人工智能的先天性。 AlphaGo Zero真正的区别性应在两方面考虑,1。区别于人,人类心灵的“白板”是指人类和知识来源于经验,人类棋手是有了围棋的规则和历史经验的知识,不同经验者之间的对抗性竞争。2。区别于AlphaGo的“监督学习”,AlphaGo Zero是在包括AlphaGo研究、设计、建造和实用所有经验基础上的围棋游戏的算法重建。 AlphaGo Zero的随机性“白板”开始实际是受其内置的人工性智能和盘面上直交网格的几何-数学性质两方面约束的。AlphaGo Zero本身就是“智能机”,能够在棋盘这种有限世界中重建一种机器对机器的对抗性。AlphaGo Zero真正的进步是作为人工智能的“机器学习”的“强化学习”(reinforcement learning)的一次成功实现。 我们可以看到,AlphaGo Zero并没有创造一种不同于现有围棋的新规则的围棋,只是在不断的自我对弈中重建了已有的围棋系统。AlphaGo Zero凭借并其巨大的机器时、空能力,以超过人的生物时空能力而取得对人的全胜,以对以往AlphaGo版本研究经验的综合和提高取得对以前的AlphaGo的全胜。 三、围棋的职业化与技术化 围棋在中国诞生,大约七世纪在日本流行,围棋的中国文化性与日本文化之间的混合具有很特殊的文化研究价值。 据有关记载,奈良时代(公元710—794)围棋开始在日本宫廷盛行,并有出入于宫中的职业棋师。镰仓时代(1185—1333),围棋在习惯于战场生活的武士中传播开来,几大封建领主(大名)织田信长、丰臣秀吉、德川家康都具有相当的棋力,民间出现围棋大家,如先后侍奉于织田信长、丰臣秀吉和德川家康的僧人日海(1558—1623),被誉为围棋“名人”、“棋所”,享有优厚俸禄,得到“官命”,并总理围棋事务,指导将军弈棋,垄断围棋等级证书的颁发等权力。1644年幕府建立了“御城棋”制度,参加“御城棋”被看作与武士们在将军面前比武同等高尚,这样,围棋对弈植入了武士道精神。日本武士道崇尚正直、信义、忠诚、礼节、廉耻、简朴、坚毅、胆识、诚实等种种美德,武士道精神以个人荣誉立命,一但丧失个人荣誉,武士不得不进行切腹自杀以保全最终武士荣誉。因此,职业化的围棋赛事程式、规则、棋手段位、个人棋风等等都与荣誉相关,正式赛事中战败者被迫降低交手棋分,这种在赛事中的降格被视为棋手的奇耻大辱,因此棋枰上的血腥之气迎面扑来,正式棋赛中的棋手几乎是押上自己一生名誉和身家性命作孤注一掷,甚有在对局中口吐鲜血或当场死亡的事例。 围棋的职业化使围棋成为一种正式的社会活动,吸引了广泛的社会参与。以当时的“棋所”四家(本因坊、安井家、井上家、林家)为核心,民间和名门望族的六段棋手均可参加棋赛,日本在职业化的道路上进一步成为日本社会生活的一部份,一直影响到以后围棋在日本社会生活中的地位。 进入现代以后的日本围棋文化受到商业和新闻业的强力支持,大体以棋院形式组织起了所有的围棋活动,围棋文化进一步普及化,全国和国际赛事成为了重要的社会性事件。围棋的职业化使棋赛的胜负之争成为主要目的,日本围棋的某些规则也与中国围棋不同,段位等级的激烈棋赛和社会强烈关注使围棋的职业化更加突出,也就使正式的围棋活动成为了竞争技术和职业化的高级技术训练。 围棋界的高手都不同程度地强调下棋的心态、境界,这主要是为了得到对棋盘局面的深度理解,由于围棋局面的形成是平面几何空间中的直交网格结构的深度重组,落子意味着对棋局发展趋势的决策,是历史经验与当前态势的偶合,因此棋手必须专心致志,使经验与个人气质结合而形成个人的棋风,棋赛中要排除一切杂念,凝集精力于直觉(棋感),使个人形成特殊的风格在当前不确定性的棋局上产生偶合,以期得到“妙手”、“鬼手”、“神之一手”,使一子之后产生一个全新的局面。所以这种基于战杀的心态培养和训练仍然是一种心理性的技术性的准备。 围棋的职业化使棋手把下棋作为社会生存的方式或手段,从而在本质上使围棋与个人的一般生活区分开来,成为某种个人的社会生存方式,同时,围棋职业化、专业化也就使职业化围棋必然走向技术化的道路。正是这种围棋的职业化和技术化使AlphaGo成为了今天人工智能研究项目中最大的成功,这也就是AlphaGo和AlphaGo Zero完胜人类的必然性前提。 四、围棋的棋艺与棋道 围棋在中国文化中大体是文人雅士的修性、娱情的文化活动,中国的古棋优雅、自由、超越,弈棋轻松、理性互动、无言而喻,故称“手谈”、“坐隐”。 “坐隐不知岩月乐,手谈胜与俗人言” (黄庭坚,弈棋二首呈任公渐),虽然偶尔以兵喻棋(“略技”),但非以棋为兵,更没有争命的意义,相反,常以棋局喻世态而求超然,与中国特色的神仙思想相呼应,人在棋局中,又在棋局外。“烂柯”这个故事的喻意就深得人心,南朝梁任坊的《述异记》和历代其他一些笔记中均有记述,其大意是,樵夫王质入山伐木,见两人在松下石台上对弈。王质观棋入迷,一人递了一枚枣子给王质,王质吃后不知肚饥,后来一人提醒王质:“你怎么还不回去?”王质回头看他的斧头,斧柄竟已烂掉,当他下山回家时,人间已逾百年。甚至宋徽宗赵括也说“忘忧清乐在棋枰”。 “礼、乐、射、御、书、数”是士人在受教育阶段接受的主要内容,“琴、棋、书、画、诗、酒、花、茶”是文人所谓八大雅事,围棋是所有这些项目中直觉理性最专门化的一种,专心也就是一种人性的基本修炼,围棋专注于理性的直觉,对于学子来说,“一心以为有鸿鹄将至”是入不了门的,但真正的修炼是对棋局的直觉理解,这是一种无言表达、基于文化的质朴理性。 相对而言,机器无所谓文化,所以也无所谓直觉。作为人工智能的智能代理(Agent)不同于算法的机器(图灵机)在于后者的输入是数值数字,而下围棋的机器如AlphaGo输入的是已经具有结构性的数据集(棋谱),即使是AlphaGo Zero也是研究人员赋予了算法的先天性,如果不学习人类的经验,研究人员不继承以前的成果是无法得到AlphaGo系列的成功的。 机器能够战胜人是围棋技术上的胜利,机器不会受到感情、情绪、现场气氛的影响,因此对于机器来说,谈不上“棋艺”。人的本质是文化的人,人能够艺术地使用技术,艺术家对人生和社会的态度、理解、和认识成为艺术品中的理性因素,虽称“艺术”并非匠艺的“技术”而是美和审美的艺术。艺术也是艺术家、批评家和观众之间的交流和相互理解,对于机器而言,只有棋盘和棋子之间的复杂关系,不会具有人性和文化的因素。机器在技术上胜过人并不奇怪,人使用工具就是因为工具是对人的技术能力的替代,对机器胜过人的担忧或恐惧并不来自机器与人在力量或思维这样的能力上强大于人,而在于迄今为止我们对于机器与人在本质上究竟有什么不同的认识和理解上并未形成共识。 “人只不过是大自然中最脆弱的芦苇,但他是会思想的芦苇”,帕斯卡尔的骄傲并未过时,机器没有人这种既是最脆弱的同时又是最强大的这个本质性。 “艺术”通常是指艺术形象的创造,但围棋的棋艺并不创造一种具象的形象,围棋的局面是一种简单形式中的抽象的形象,围棋是抽象的局面的创造,因此与直觉的审美和情感不同,棋艺要求基于几何性的一种直觉的超层次的理解和创造,这种创造性又是在双方对抗性的个性与共性中进行的,所以围棋对局不仅是技术的较量,更是从感受到对方的气质,性格,修养的内在性的无言沟通,所以围棋的棋艺是一种抽象形象的共同创造和互动中的内在交流。 日本的围棋文化重视棋艺中的礼仪(艺、品、理、规、礼),对棋具和相关的小道也非常用心,围棋与花道、茶道等一样,成为了一个非常精细的文化生活体系,体现了日本文化的特质。 围棋界普遍承认,围棋棋手的人品也就是人的棋品,这是指棋手的修养与棋术的关系,人们普遍地把棋赛的临场心态,对战略思想、战术机会的把握等作为高级棋术素质,都是以棋为人,称之为“棋道”,实际上,棋艺建立在人品之上,真正的棋道是人道,是中国文化和中国学术理性的一种无穷境界:“弈之为道,数叶天垣,理参河洛、阴阳之体用,奇正之经权,无不寓焉。是以变化无穷,古今各异,非心与天游、神与物会者,未易臻其至也。”(清,施定庵,弈理指归,序) 中国传统文化中文人的纯文化生活能够将世俗人生消融在理性的超越之中,琴棋书画、诗词歌赋创造的境界是实在世界的超越,这与中国围棋的直觉纯粹和超越性具有一种共同的理性美感,所以中国文人以诗言志的本能在以围棋为诗的表达中能得到一种越界的融和: 黄梅时节家家雨, 青草池塘处处蛙,有约不来过夜半, 闲敲棋子落灯花。(赵秀师,约客)——棋为人境,相约相忘。 山僧对棋坐,局上竹阴清,映竹无人见,时闻下子声。(白居易,池上二绝)——人在局中,又在局外。 玉子纹楸一路饶,最宜檐雨竹萧萧。羸形暗去春泉长,拔势横来野火烧。守道还如周柱史,鏖兵不羡霍嫖姚。浮生七十更万日,与子期于局上销。(杜牧,送国棋王逢)——人、棋相喻是棋艺,人、棋同境是棋道。 闲看数招烂樵柯,涧草山花一刹那,五百年来棋一局,仙家岁月也无多。(徐文长,题王质烂柯图)——棋局也是历史剧,中国本土文化特色的人、仙同质,是中国传统文人的最后的精神寄托。 五、结语 当我们迷惑于机器是否会有感情、意识时,不妨首先去体会、研究一下,作为文化的“人”的实质是什么?这有助于我们走出人工智能给我们带来的忧思。 本文相关内容和参考资料除已有文内夹注外,可参见周剑铭、柳渝:中国文化和中国思想;中、西文化和科学、人文两种“两种文化”的交汇;算法、不确定性和不确定性问题(NP)理论;智能哲学等网上系列文章。[详情]
GoogleDeepMind研究科学家、《星际争霸》AI计划负责人OriolVinyals将在EmTechChina全球新兴科技峰会(2018年1月28-30日[详情]
今年5月在乌镇大战谷歌人工智能AlphaGo惨遭三连败的世界围棋职业九段棋手柯洁8日再次现身乌镇,出席2017首届智能金融知识图谱论坛。这一次,他是为人工智能站台。 他在现场表示,未来是属于人工智能的,自己再与人工智能对抗是没有任何意义的。 他说,围棋界是崇拜强者的,自己输给AlphaGo有幸和不幸,不幸是遇到了无法超越的对手,而幸运的是作为棋手,有幸见到了真正无敌的存在。 未来,在围棋之外,他也希望能往金融或教育领域进行探索尝试,比如将人工智能应用到围棋教育上。 “结果不出意外的,我成为了人工智能的垫脚石。” 他本人也很感慨,很多围棋圈外的人知道自己可能并不是因为围棋,而可能是因为AlphaGo,因为人工智能。“对于我而言,人工智能始终是一个避不开,必须面对的话题。” 时隔半年,他已经成为人工智能的“推崇者”,他在多个场合表态“未来是属于人工智能的。”。 他说,围棋界的人应该说是最早与人工智能接触的一批人类,未来90%的行业都可能遭遇人工智能的冲击,围棋界正好先接触,迷茫之后,会发现人类有自身价值,情感是机器无法代替的。比如机器人也可以给人送咖啡,但总归没有人类的亲切与和平相处的感觉。 而对最近刚刚拿到沙特公民身份,成为历史上首位机器人公民的Sophie,柯洁坦言还是觉得有些恐怖。 今后,柯洁是否还要在围棋上继续大战人工智能? 他表示,以自己现在的状态,无论怎么努力,这一辈子都不可能赢AlphaGo。因为它的棋远远超出了我们的想象,超出了我们所认知的境界。 “如果是大家真的很喜欢看我被虐的话,我会义无反顾地去对战;如果有一天,科技已经能让我植入芯片,我也会义不容辞的植入芯片,我也会去报仇。” 现在看来,柯洁对未来的规划似乎与人工智能挂上了点钩。“人工智能在未来绝对是不可限量的,潜力也都是无限的。” 他说,棋手可以通过AlphaGo行棋的思路从中获益。传统印象中下出一些理所当然的棋,在人工智能的眼中都是错误的。它有一条更简洁、更快捷、更有效的方法颠覆传统的下法和认知。 通过学习,人类的棋艺也会比过去更强大一些,理论也会比过去更先进。人工智能也可以对人类棋手下的每一步棋做估值评分,可以对每一步棋打分。 “说职业棋手苦中作乐也好,一种全新的观赏方式也好,这也是之前没有想到AI带来的好处。学围棋的人越来越多,非常感谢AlphaGo为围棋带来这么好的宣传,也感谢人工智能。” “我只会下一点围棋罢了,能够改变生活,改变未来的是这些非常强的人工智能。” 贵为世界排名第一的棋手,他一直提的是人工智能大数据如何改变了人们的出行方式。他相信,在其它行业,比如教育行业,人工智能会带来非常大的改变。 他表示,自己在围棋之外,也想在工作闲暇之余多做一些推广,和更多跨界的人士交流。“我可能会关注金融、教育行业,这都是我可以去跨界,多开拓自己的思路,我觉得这也是未来的一个方向。” (本文作者:赵小燕)[详情]
来源:弈客围棋 作者:侯靖哲、何旸团队 本局摘自AlphaGo Zero VS AlphaGo Master 第14局。(master执白) 进行至第17手是双方出现率最高的布局 右上定型大致两分,其中白28有反击的手段—— 白1.3是最容易想到的反击手段,如果黑4强吃白棋,将被白棋简明击溃。 白1如果简单地长一个,黑2先手立完尖在4位,黑棋好调。 白2.4扳粘,黑5尖顶只此一手,白6.8简明处理,由于左边白棋太厚、右上黑四子略显凝重,黑战斗不利。 白2.4最强抵抗,黑5.7必然,白8先夹一下破坏眼位,黑13扳住强硬!白14扳被黑15妙手一断!白动弹不得。 35至45是比较正常的进行。 这样虽然是正常的定式,但在这个场合黑A.B二子太过重复,黑明显不好。 白58神来之笔!60是连贯的好手! 黑1若粘,白2简单飞一个,之前的交换明显得利。 黑1若还是尖出,白2压住,黑3.5扳断,白6打吃黑已无法连回黑1一子,这样就可以看出白58的巧妙之处! 弈至64白调子不错。 黑65打入好点!白76.80意在攻击黑棋左边几子,黑91.93整形好手,94~102这几步棋体现了AI对局面的掌控能力 黑139寻求眼位,白140灭眼,黑141以下形成劫争, 弈至174形成大转换,可谓是沧海变桑田!白成功确立优势。 黑197殊死一搏! 但无奈白198以下计算精准,黑大龙被杀已无力回天。 [详情]
来源:弈客围棋 作者:白石勇一 翻译:王振飞 继续介绍AlphaGo Lee对Zero的第6局。 1图(实战) Lee执黑先行。 下至白△,与第3局的布局完全一致。 第3局时,双方选择了黑A白B的顺序来下。 黑△是棋筋,通常这里总是要补的。 然而…… 2图(实战) Lee黑1居然脱先了!! 白2断,黑棋外势崩溃。白4之后,将来还留有A位枷的手段。 一般都认为黑棋这样是不可取的。但执黑的Lee继续黑5点三三攻击白角。 我的理解是:Lee认为右上角白棋反正已经活了,继续在这里下,也只不过是继续扩大实地而已。所以此时抢占别处非常重要!虽然这么说,但老实讲,Lee君,我还是觉得右上角不能脱先啊!! 在AlphaGo的系列软件中,Lee的棋谱,其实我们之前只见过8盘棋(译者注释:与李世石人机大战5盘,自我对弈3盘,每步5秒),所以我们直到现在为止方才知道Lee下棋时的全面表现。 但是既然Lee这么下,也就说明之前人类认为这里无论如何是一定要补的,未必就是正确。 那么点三三之后,白棋通常有B,C,D三种应法。那么Zero会怎么选呢? 3图(实战) Zero一种都不选,直接1,3吃掉黑点三三一子,粗俗有力。下法非常实战化。 4图(实战) 黑1,5拔花。棋形很厚。 这里我们注意一个细节——黑△一子的位置有点美中不足。考虑到厚薄关系,此时黑△一子明显摆在A位更加理想。这也为之后白棋的打入埋下了契机。 感想:Lee在面对Zero时,感觉策略有些不足,只会一味硬怼是不行的呀。[详情]
作者:王丹蕾 陈庚 吴婉瑜 央广网厦门11月5日消息(记者陈庚 吴婉瑜)第十届海峡两岸(厦门)文化产业博览交易会海峡两岸围棋与人工智能邀请赛于11月3-6日在厦门举行,围棋界和人工智能围棋大咖云集,共襄盛举。本次围棋和人工智能邀请赛有聂卫平、马晓春、王立诚、罗洗河、林至涵等棋界大咖助阵,也有来自世界排名第二的CGI和第四的天壤等围棋人工智能机器前来参战。4日举行的聂卫平携手天壤人工智能机器对战王立诚及其携手的CGI人工智能机器战队共进行了237手棋,王立诚、CGI中盘战胜聂卫平、天壤人机组合。 本届比赛有别于以往的围棋比赛,11月4日,聂卫平携手天壤人工智能机器对战王立诚及其携手的CGI人工智能机器战队。11月5日举行两岸大学生人机队际赛及世界冠军人机对战赛。世界冠军人机对战赛由世界冠军马晓春九段迎战台湾CGI人工智能机器,同时世界冠军王立诚九段也将与大陆人工智能机器天壤对阵。 薛贵荣:人工智能在“自我学习” “四位的人机配对赛有很大的不确定性,棋风都不一样,比赛的时候如果思路比较一致就下得比较流畅,如果思路不同的话下起来就比较麻烦。”天壤创始人及CEO薛贵荣介绍道。来自上海的天壤是人工智能的新星,公司成立仅一年多,在人工智能围棋领域突飞猛进,首届世界智能围棋赛中多次屠龙被冠以“死活达人”称号,最终杀入四强。“以前比赛我们只需要考虑两台机器,这次是我们第一次人机配对赛。我们也在探索,将来比赛中,应该是以谁为主的,比如说以人为主还是以机器为主,像今天的聂老师、王老师都是有棋风,之后机器怎么调整。”薛贵荣表示,人工智能也像人一样需要通过不断实战来“自我学习”,通过对抗来总结和改进。“我们的人工智能每天要生产几十万盘的棋局,数据大了之后,从中学习棋局的特征。这场活动可以帮我们收集变数增加的情况下的数据。人工智能进步很重要,人机协作在一段时间内也非常重要,我们接下来会关注人机协作时有差异的话应该怎么发展。” 林至涵:人机配对赛能吸引更多围棋爱好者加入 5日,在厦门机电设备展示交易中心将举行两岸大学生人机队际赛。台湾参赛队伍由林至涵担任主教练,带领CGI人工智能机器和4名台湾大学生与大陆参赛队伍对技。林至涵来自台湾棋院,是台湾四大九段之一。“我们已经知道人类与人工智能对抗时候的弱势,那今天的活动这种人机搭档的方式很好,以前的围棋世界赛里就有类似的两人协作的,现在把其中一个人换做机器。”林至涵认为,围棋有两个发展层面,一个是追求自己的围棋造诣,一个是推广。“人类一直都在追求自己越来越强。但在人工智能面前突然发现人类下不赢人工智能。我们需要找一个方式再去推广,让大家觉得围棋是个好玩的东西。围棋很难,大家要多认识才能产生兴趣,透过人机配对赛的方式可以吸引更多围棋爱好者加入。” 叶彧熏:我们是一群热爱围棋的科技人 “原本我们网络下棋只能看到冷冰冰的棋子和打字,但是透过我们的平台可以直播、对话、打赏,还可以通过AI和世界冠军对弈,促进人面对面对弈的形式。”90年的叶彧熏来自台北,是围棋业余七段棋手,如今,他与一群围棋爱好者共同创办了围棋人科技股份有限公司。叶彧熏小时候在北京围棋机构训练了两年,大学又在厦大做了半年的交换学生,叶彧熏熟悉两岸围棋文化,看到今天的两岸围棋与人工智能邀请赛感到很兴奋。“这次活动很盛大,大陆在围棋产业的促进推广上很下大气力。我们是一群热爱围棋的科技人,我们公司致力于成为全球性的围棋网络平台,希望多一些大陆的棋友来交流。未来会继续寻找两岸创业合作的机会。”[详情]
11月5日,2017“象屿杯”海峡两岸围棋与人工智能邀请赛,两岸世界冠军人机对战赛在厦门象屿集团机电设备展示交易中心战罢,马晓春中盘胜CGI。本局马晓春以一招自杀妙手屠龙,重现了天龙八部里珍珑棋局的一幕。 图1 图1:马晓春执白对阵CGI。棋局进行至如图局面,乍一看白棋落后很多,但仔细一瞧,黑棋下边大龙死活好像有些问题。 图2 图2:白棋提,看似自杀,但…… 图3 图3:黑1提回之后,白2可以打吃,破掉黑眼。这种棋型和《天龙八部》里描述的珍珑棋局有些像,白棋置之死地而后生,只是本局不像作品中渲染的那么玄之又玄罢了。实战黑3粘上,可能是CGI出现了bug,白4粘,黑棋局部净死。 图4 图4:本来黑棋可以在1位做劫顽抗,但不知道为什么CGI选择了实战净死的走法。 图5 图5:后面的进行变化比较简单,黑棋大龙一命呜呼,CGI又坚持了几手便投子认负了。 赛后马晓春表示一直瞄着黑棋大龙的这个弱点,想考一考电脑,没想到竟然考住了。 (文玄)[详情]
11月5日,2017“象屿杯”海峡两岸围棋与人工智能邀请赛,两岸大学生人机队际赛和个人对抗赛均是台湾大学生联队胜厦门大学生联队,台湾大学生队取得了此次大学生交流的胜利。 两岸大学生人机队际赛上午进行,台湾大学生联队林至涵担任主教练,上场棋手与CGI搭档,厦门大学生联队罗洗河任教练,上场大学生与天壤配合。这盘棋一波三折,天壤一度判断己方胜利已经超过了80%,但人类棋手一着不慎,又将胜果送了回去,最终台湾大学生联队取得了队际赛项目的胜利。 台湾小美女陈若婕抢镜 下午两队八位大学生棋手,捉对厮杀,最终台湾大学生联队3比1胜出,详细赛果如下: 戴飞栋(厦门)胜 陈若婕(台湾) 穆安顺(厦门)负 林晓彤(台湾) 党欣(厦门)负 杨孚德(台湾) 喻竞哲(厦门)负 萧义修(台湾) 这样台湾大学生联队以2比0的总分(上下午的比赛各算1分),取得了此次两岸大学生人机队际赛的胜利。 (文玄)[详情]
11月5日,2017“象屿杯”海峡两岸围棋与人工智能邀请赛,两岸世界冠军人机对战赛在厦门象屿集团机电设备展示交易中心战罢,马晓春屠龙中盘胜CGI,王立诚中盘胜天壤,人类棋手大获全胜。马晓春以一招自杀妙手屠龙,重现了天龙八部里珍珑棋局的一幕。 两岸世界冠军人机对战,中国的世界冠军马晓春九段对阵中国台湾的围棋人工智能程序CGI,后者不久前取得了首届世界智能围棋公开赛的亚军;王立诚对阵来自上海的人工智能天壤,后者是世界智能围棋公开赛的第四。 马晓春执白对阵CGI。前半盘白棋早早陷入被动,人工智能特有的强大全盘控制能力是人类棋手难以比拟的。但马晓春下得非常顽强,虽然局势不利,但他并没有放弃,耐心地等待着时机。功夫不负有心人,人工智能围棋在死活上似乎容易出现“盲点”,本局马晓春创造了一道完美的实战死活。 马晓春自杀妙手屠龙 黑棋下边大龙倒扑吃掉了白棋三子,但这个棋型有个弱点,白棋可以送死,然后再破掉黑棋的眼位。CGI显然没有注意到这个变化,实战当马晓春图穷匕见的时候,黑棋的应对又出现了问题,把打劫活走成了净死,胜负瞬间逆转。这盘棋有些像天龙八部里的珍珑棋局,白棋要置之死的而后生。 王立诚也捍卫了人类世界冠军的尊严 另外一场人机大战是漫长的功力比拼,王立诚白棋占据了四个角的实地,天壤黑棋则下得非常厚实,整盘棋双方一直在拉锯战。最终还是王立诚的功力深厚,小胜的局面不可动摇。最后时刻天壤黑棋空里出棋,王立诚中盘胜出。 马晓春与人工智能机器人对话 赛后,马晓春非常开心,在赛场厦门象屿集团机电设备展示交易中心里转了转,还跟人工智能机器人对话。这里可以说是人类棋手的福地,两场人机大战都是赛前并不被看好的人类世界冠军取胜。 (周游)[详情]
据海峡导报报道。 昨日下午,海峡两岸文博会现场,备受关注的“象屿杯”海峡两岸围棋与人工智能对战开始了!棋圣聂卫平携手人工智能“天壤”,对战来自台湾的世界冠军王立诚和人工智能CGI。 两岸人机携手围棋对战 下午2点半,会展中心C3主舞台被群众围得水泄不通,可见聂卫平携手人工智能的对战引发的关注度。 聂卫平接受采访时坦言:“这一生参加过很多的比赛,跟人工智能配对,一起参加邀请赛,还是第一次,是全新的一次体验。比赛结果不重要,重在两岸的接触和交流。” 离比赛还有15分钟,聂卫平坐在椅子上闭目养神,进入比赛前的状态调整。来自台湾的王立诚也是屏气凝神,准备对战。 下午3点整,比赛正式开始。聂卫平和王立诚的旁边均坐着两位“副手”,他们负责“听”人工智能“发号施令”,为它们取棋和下棋。 一场没有硝烟的围棋人机大战打响:聂卫平走一步,轮到王立诚,之后人工智能“天壤”也走一步,再轮到人工智能CGI…… 经过2个多小时的酣战,双方交锋至第237手棋,最终,王立诚和人工智能CGI战胜聂卫平和“天壤”的人机组合。 人工智能机器人风头正劲 其实,来自的台湾人工智能CGI近来风头可劲了。上半年在一场互联网大会上,它搭档黑嘉嘉也战胜过各路好手登顶。 吴毅成教授是此次比赛CGI的负责人。他表示,之前参与的比赛多是由AI程序独力通过运算来对弈,这次比赛则是由人类棋手和AI组队,轮流落子,意义非凡。未来人与机器如何去合作,这是一次很好的尝试。“这两天受到大陆许多厂商的合作邀约,我们都是欢迎的,因为大陆在人工智能技术上处于世界前沿。” 来自上海的“天壤”,是人工智能界冉冉升起的一颗新星。“天壤”创始人薛贵荣透露:“其实它就是以大量人类的棋谱为起点,然后用两个同样的系统不断对弈,产生人类未必熟悉的棋路。在这个过程中再进行不断地迭代,修正下棋的策略,达到棋力的提升。” 薛贵荣说,相比计算机,人类棋谱收集的速度是远远落后的,计算机一个多月内就能产生上亿盘的棋谱。 薛贵荣致词 昨日的人机对决,还吸引棋界不少“大腕”来助阵,有马晓春、罗洗河、林至涵等人。 今天下午3点,在厦门机电设备展示交易中心一楼,也将举行世界冠军人机对战赛,马晓春将迎战人工智能CGI,王立诚将与大陆人工智能“天壤”对阵。[详情]
据泉州晚报报道。 本报讯 (记者陈智勇 文/图)昨日下午,海峡两岸围棋与人工智能邀请赛在厦门会展中心举行,“棋圣”聂卫平与“天壤”组合官子出现失误,不敌台湾世界冠军选手王立诚与“CGI”搭档。 今日,精彩还将继续。 两岸围棋名将助阵 此次比赛,有多家媒体现场向全国观众现场直播——聂卫平携手“天壤”人工智能机器,对战台湾世界冠军选手王立诚及其携手的“CGI”人工智能机器战队。 聂卫平当年在中日擂台赛一夫当关万豪取11连胜,刮起“聂旋风”影响至今。如今聂棋圣为中国围棋摇旗呐喊,助阵围棋活动不遗余力。人工智能AlphaGo名震江湖之际,聂卫平也曾亲自出马与之手谈,表示要脱帽致敬向人工智能学习,以后有机会多切磋棋艺。“与人工智能携手参加比赛,我还是第一次。”赛前,聂卫平如是说。 来自上海的“天壤”是人工智能界冉冉升起的新星,在首届世界智能围棋赛中多次屠龙被冠以“死活达人”称号,神勇杀入四强。 此次参赛的另一围棋人工智能“CGI”由台湾交通大学吴毅成教授团队研发,近来风头正劲。而王立诚在日本开创了属于自己的时代,曾斩获棋圣、亚洲杯等众多头衔,并多次杀入世界大赛决赛,夺得过LG杯和春兰杯世界冠军。他说:“人工智能已经超越了人类,此次与人工智能配对参赛,也是第一次,这种组合非常有意义,比单独的人机对弈更具挑战。” 马晓春下午迎战“CGI” 今日,海峡两岸围棋与人工智能邀请赛精彩还将继续。 上午,两岸大学生人机队际赛率先上阵,大陆参赛队伍由罗洗河担任主教练,带领天壤人工智能机器和厦门4名大学生与台湾参赛队伍比赛,台湾参赛队伍由林至涵担任主教练,带领CGI人工智能机器和4名台湾大学生。 下午,将举行世界冠军人机对战赛。世界冠军马晓春九段将迎战台湾CGI人工智能机器,同时世界冠军王立诚九段也将与大陆人工智能机器天壤对阵。[详情]
文章来源:公众号 机器之心 (选自arXiv 机器之心编译 参与:路雪、李泽南) 不久前 DeepMind 强化学习团队负责人、AlphaGo 项目负责人现身 Reddit 问答,其中一个问题是‘围棋和星际争霸 2 哪个更难?潜在技术障碍是什么?’近日,DeepMind 发表论文,提出了多智能体强化学习方法,有望为星际争霸等游戏的 AI 技术的开发提供帮助。该论文也将出现在 12 月美国长滩举行的 NIPS 2017 大会上。 深度强化学习结合深度学习 [57] 和强化学习 [92, 62] 来计算决策策略 [71, 70]。传统来说,单个智能体与所处环境进行重复互动,从观察结果中学习,进而迭代地改善自己的策略。受近期深度强化学习成就的启发,DeepMind 的研究人员对多智能体强化学习(multiagent reinforcement learning,MARL)重新燃起了兴趣 [88, 16, 97]。在 MARL 中,多个智能体在一个环境中同时互动和学习,可能是围棋和扑克中的竞争模式,学习如何交流的合作模式,也可能是二者皆有。 MARL 最简单的形式是独立强化学习(independent RL,InRL),每个学习器不理会其他智能体,将所有互动作为自己(‘局部’)环境的一部分。这些局部环境是非稳态和非马尔可夫的 [55],导致在很多算法中缺乏收敛保证,除此之外,研究者还发现这些策略会与其他智能体的策略产生过拟合,从而无法实现很好的泛化效果。强化学习社区对环境过拟合的研究还很少 [100, 67],但是 DeepMind 的研究人员认为这在多智能体设置中尤其重要,该设置中一个智能体必须根据观察到的其他智能体的行为动态地作出反应。经典的技术是收集或逼近额外信息如联合值(joint value)[60, 18, 28, 54]、使用适应性学习率 [12]、调整更新频率 [47, 79],或对其他智能体的动作进行在线动态回应 [61, 49]。但是,近期研究中出现了一些特例 [21, 78],他们关注(重复)矩阵博弈(matrix game)和/或完全可观察的环境。 有多个建议能够在多智能体设置中处理部分可观测环境。当模型完全可知,且设定是与两名玩家完全对抗时,可以使用策略迭代方法,该方法基于使用专家级抽象(expert abstraction)可以进行很好扩展的遗憾最小化(regret minimization)[26, 14, 45, 46]。近日,研究者将这些方法和深度学习结合起来,创建了无限下注德州扑克专家级 AI 系统 DeepStack [72]。大量研究在通用设置下,通过扩展信念状态和来自 POMDP 的贝叶斯更新 [27],处理去中心化合作问题 [74, 77]。这些模型具备较强的表达能力,得出的算法也比较复杂。在实践中,由于难解性,研究者通常使用近似式(approximate form),通过采样或利用结构来确保模型保持优秀性能 [40, 2, 66]。 在这篇论文中,DeepMind 的研究者介绍了一种新的指标,用于量化独立学习器学得策略的关联效果,并展示了过拟合问题的严重性。这些协调问题在完全可观测的环境中已经得到充分研究 [68]:DeepMind 的研究者在部分可观测的混合合作/竞争设置中观察到了类似问题,并证明其严重性随着环境可观测的程度降低而增加。DeepMind 的研究者提出一种基于经济推理(economic reasoning)的新型算法 [80],该算法使用(i)深度强化学习来计算对策略分布的最佳回应,(ii)博弈论实证分析(empirical game-theoretic analysis)来计算新的元策略分布。研究者为去中心化执行进行中心化训练:策略以分离的神经网络的形式呈现,智能体之间没有梯度共享或架构共享。基本形式使用中心化支付矩阵(payoff table),但在需要更少空间的分布式、非中心化形式中该矩阵被移除。 图 1:Double Oracle 算法。 DeepMind 的研究人员展示了他们的主要概念性算法:策略空间回应 oracle(policy-space response oracles,PSRO)。该算法是 Double Oracle 算法的自然泛化,其中元博弈是策略而非动作。它还是 Fictitious Self-Play 的泛化 [38, 39]。与之前的研究不同,该算法可以插入任何元求解器以计算新的元策略。在实践中,无需任何域知识,使用参数化策略(函数逼近器,function approximator)泛化至状态空间。 图 4:(a)两玩家 Leduc 扑克中 DCH 参数在 NashConv 上的效果。左:解耦 PRD;中:解耦 RM;右:Exp3。(b)MAUC 对抗 cfr500 的渗透图。 DeepMind 也展望了新方法的未来应用方向,研究人员正在考虑保持基于策略差异损失惩罚的差异性,一般响应图拓扑,实时语言游戏和 RTS 游戏等环境,以及其他需要进行预测的架构,如对立建模、在辅助任务中进行未来状态估测。DeepMind 还希望研究快速在线适应及其与计算心智理论的关系,以及对使用继任者特征的类似策略进行泛化(迁移)的 oracle。 论文:A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning 论文链接:https://arxiv.org/abs/1711.00832 要想实现通用智能,智能体必须学习如何在共享环境中与他人进行互动:这就是多智能体强化学习(multiagent reinforcement learning,MARL)遇到的挑战。最简单的形式是独立强化学习(independent reinforcement learning,InRL),每个智能体将自己的经验作为(非稳态)环境的一部分。这篇论文中,我们首先观察到,使用 InRL 学得的策略能够在训练过程中与其他智能体的策略产生过拟合,但在执行过程中无法实现充分的泛化。我们引入了一种新的指标:共策略关联(joint-policy correlation),对该效果进行量化。我们介绍了一种用于通用 MARL 的算法,该算法基于深度强化学习生成的多种策略的几乎最佳回应,还进行博弈论实证分析来计算策略选择的元策略。该算法是之前算法的泛化,如 InRL、iterated best response、double oracle 和 fictitious play(虚拟对局)。之后,我们展示了一种可扩展的实现,使用解耦元求解器(meta-solver)减少内存需求。最后,我们在两种部分可观测的设置(gridworld coordination games 和扑克)种展示了该策略的通用性。[详情]
文章来源:公众号 量子位 “人类总算能摆脱被统治的阴影”。 这两天,一场《星际争霸》的人机对抗“表演赛”,让不少人类感到扬眉吐气。毕竟在这场比赛中,韩国顶级职业玩家Stork(宋炳具),一鼓作气击败了四个AI玩家,赢得500万韩元奖金! 约合人民币近3万元。 宋炳具选手 整场比赛流程是这样的:人类阵营先由两个普通学生星际玩家出场,分别挑战上个月《星际争霸AI大赛》的冠军:ZZZK、来自挪威的TSCMO、主办方韩国世宗大学研发的MJ。 结果AI阵营分别以3:0、2:1击败了普通人类星际玩家,唯一的败仗由韩国星际AI贡献。总比分算是5:1。 然后就是Stork登场,以一波4:0碾压AI,挽回人类颜面。 为什么赢了四场?因为原本预计会有三场精彩的人机对决,但是Stork赢得实在是太轻松了,没办法只能临时加赛,让《星际争霸AI大赛》上排名第六的CherryPi压轴登场,结果Stork使用神族侦察机就直捣敌窟。 尽管CherryPi来自大名鼎鼎的Facebook AI研究院,但成绩真是一贯不咋地。 AI选手 带中文解说的现场视频,可以前往这里收看: https://www.bilibili.com/video/av15909479/ 如果对全程感兴趣,可以科学前往这里收看: https://www.youtube.com/watch?v=L54zoUwVPLI 不够AI的AI 顶级职业选手战胜了AI,乍一听,星际界这个情况似乎跟围棋界形成了鲜明的对照。围棋这个领域,AI战胜了顶级职业选手。 但,还真不是一回事儿。 相比之下,AlphaGo是一套复杂的人工智能系统,现在已经可以几乎不借助任何人类知识,自行学会下围棋,并且迅速的成长为高手。 关于最新版AlphaGo Zero,有人花了一张图进行解读。如果你能看懂的话,应该还蛮有意思的…… 而参加这次“星际争霸人机大战”、以及上个月《星际争霸AI大赛》的人工智能系统,都在相当初级的阶段。 比如其中最厉害的ZZZK,背后是澳大利亚的程序员Chris Coxe。他独自创建了这个AI,但其中只有一些简单的学习功能,背后更多是各种预先编辑好的策略。 量子位之前也介绍过,ZZZK只能执行一种单基地Rush战术。另外,这个ZZZK能在游戏中学习一些策略,以判断哪种Rush是最有效的。 星际AI大赛成绩单 当然与普通玩家相比,星际AI还是有着人类难以比拟的优势,比方每分钟可以完成峰值2万次的操作,而人类大概是300次。 由于AI玩的不够好,就不详细解读它们的策略了。有兴趣的可以看上面提到的视频。Stork表示,跟他对局的AI出于普通玩家的中等水平。 总而言之,这次Stork击败的AI,其实不够AI。 DeepMind在干嘛 为什么AI在星际这个领域没能大杀四方? 很简单,太难了。 星际是个实用的基础AI研究环境,因为游戏本身复杂多变。AI想要取胜需要同时做多手准备,比如管理并创造资源、指挥军事单位和部署防御结构等操作需要同时进行,逐步完成。此外,AI还需预测对手的策略。 在围棋领域,Facebook开发的AI最终还是敌不过DeepMind开发的AlphaGo。而现在Facebook又在星际领域率先推出AI。 不管是有心无心,新的“竞争”开始了。不过,DeepMind在干嘛? DeepMind当然不会错过星际;以及DeepMind选择的路径有点不一样。首先,赛场就不一样,Facebook在星际中搏杀,而DeepMind选择了星际2。其次,DeepMind没有直接推AI,而是搞了一套:SC2LE。 这是一套星际2工具包,用于加速AI研究。由DeepMind和暴雪联合发布,这个工具包中包括: 机器学习API:由暴雪开发,将研究人员和开发人员接入游戏,并自带首次发布的Linux工具包。至此,Windows、Mac与Linux系统均可在云端运行。 匿名游戏回放数据集:包含65000多场游戏记录,在接下来的几周将增加至50万场,帮助实现智能体间的离线比赛。 开源的DeepMindPySC2工具包:方便研究人员使用暴雪的特征层API训练智能体。 一系列简单的增强学习迷你游戏:帮助研究人员在特定任务上测试智能体的性能。 概述开发环境的论文:记录了迷你游戏的初始基线结果、监督学习数据以及智能体间完整的对抗记录。 简而言之,可以看看下面这个视频: 不止星际 AI感兴趣的游戏,不止星际一个。 DeepMind的名字深入人心,可能是因为下围棋的AlphaGo。不过,最初为这家公司在人工智能领域建立了赫赫声望的,是雅达利(Atari)的游戏。 2015年2月,也就在AlphaGo和李世乭下棋之前一年多,DeepMind第一次登上了《自然》封面,他们发表了一篇论文:Human-level control through deep reinforcement learning。这篇论文展示了DeepMind的算法如何学会了49种雅达利游戏,并在其中23种里击败人类。 比如说Video Pinball、Boxing、打砖块(Breakout)、Star Gunner、Robotank等等,AI都很擅长。 DQN打雅达利游戏的战果 这篇论文中的算法DQN,后来成了谈到AI打游戏就一定会说起的一种算法,DeepMind和同行们都对它进行了不少改进,前不久,DeepMind还提出了一种DQN的新变体:Rainbow,论文提交给了AAAI 2018。 热衷于雅达利游戏的,还有马斯克等人联合创立的AI研究机构OpenAI。 在2016年发布的强化学习开发工具包OpenAI Gym中,集成了多个环境,其中就包含基于Arcade学习环境的雅达利游戏。 而年底发布的人工智能测试训练平台Universe更是集游戏之大成,除了2600中雅达利游戏之外,Universe里还有1000个Flash游戏。后来,Universe还引入了《侠盗猎车手5》(GTA V),让研究者用AI在虚拟世界里开车。 兴趣广泛的OpenAI,除了集成到Universe平台上的游戏之外,今年还在DotA 2圈的“世界杯”TI7邀请赛上火了一把,影魔中单solo完虐了职业选手Dendi。 可能还有《王者荣耀》。 此前多个媒体报道称,马化腾表示正在测试AI对战手游玩家。这个信息也被广泛解读为腾讯正在训练AI打《王者荣耀》。正经的说,游戏AI是腾讯一个明确的研究方向,包括LOL中未来可能也会有一个AI大魔王。 为什么科技公司不惜重金打游戏 众多科技公司,都对AI打游戏有着浓厚的兴趣,并不是一个偶然。 对于AI研究者来说,这些游戏天然为人工智能提供了一个比真实世界更简单的交互环境,又能为AI设定一个清晰的目标,同时,还提供了一个简单易用的衡量标准。 AI从游戏中学到的策略,对于现实世界中的其他领域的决策来说也有参考价值。比如说DeepMind用来打砖块的DQN,在对话系统、文本生成上就有着不错的效果,也能用来控制机器人避障、导航。 AI打GTA V,甚至本来就是为了在高仿真环境中,训练人工智能来识别街道、物体。游戏中本身就包含了大量的标注数据,比真是数据量更大、更容易获得。如果你在训练无人车的时候没有Waymo Carcraft那么高级的模拟环境,GTA也是个勉强能接受的折衷选择。 和很多打电子游戏的AI同样用了深度强化学习算法的AlphaGo,就在围棋界“独孤求败”之后找到了自己在现实世界中的价值,DeepMind说,他们期待用AlphaGo的算法,来解决蛋白质折叠、降低能耗、寻找革命性的新材料等等问题。 实际上,从2016年开始,Google就开始在数据中心里应用AlphaGo的算法,来控制风扇、空调、窗户、服务器等等的电量。谷歌说,AI帮他们提高了大约15%的能源利用效率。 打游戏的各位AI们成才之后,大可以多向这位下棋的前辈学习。[详情]
第十届海峡两岸(厦门)文化产业博览交易会“象屿杯”海峡两岸围棋与人工智能邀请赛即将于11月3-6日在厦门举行,棋界和人工智能围棋大咖云集,共襄盛举。 围棋是中华传统文化精髓,也是两岸文化系列交流活动重要组成部分,人工智能是当今世界最体现科技水平的产业之一,也是未来最具潜力的市场之一。围棋结合当下人工智能最新发展,将围棋和人工智能成果通过比赛形式展现,更好推动围棋和人工智能普及和发展。 本次围棋和人工智能邀请赛将有聂卫平、马晓春、王立诚、罗洗河、林至涵等棋界打开助阵,也有来自世界排名第二的CGI和第四的天壤等围棋人工智能机器前来参战。 比赛日程 本届比赛也有别于以往的围棋比赛,11月4日下午15:00,在会展中心C3展厅大堂主舞台,棋圣聂卫平携手天壤人工智能机器对战王立诚及其携手的CGI人工智能机器战队。届时厦门卫视、新浪体育和天元围棋将向全国观众现场直播。比赛现场还邀请了林至涵、陈盈为主讲嘉宾现场讲棋。林至涵来自台湾棋院,夺得2012世界智力精英运动会男子个人铜牌,是台湾四大九段之一。 11月5日上午9:00,在帝元维多利亚大酒店,将举行两岸大学生人机队际赛。大陆参赛队伍由罗洗河担任主教练,带领天壤人工智能机器和厦门4名大学生与台湾参赛队伍比赛,台湾参赛队伍由林至涵担任主教练,带领CGI人工智能机器和4名台湾大学生。 11月5日当天下午15:00,在厦门机电设备展示交易中心一楼,将举行世界冠军人机对战赛。世界冠军马晓春九段将迎战台湾CGI人工智能机器,同时世界冠军王立诚九段也将与大陆人工智能机器天壤对阵。 棋圣聂卫平当年在中日擂台赛一夫当关万豪取11连胜,刮起“聂旋风”影响至今。如今聂棋圣为中国围棋摇旗呐喊,助阵围棋活动不遗余力。人工智能AlphaGo名震江湖之际,聂卫平也曾亲自出马与之手谈,表示要脱帽致敬向人工智能学习,以后有机会多切磋棋艺。 马晓春是中国首位围棋世界冠军,曾夺得东洋证券杯和富士通杯世界冠军,创下名人13连霸纪录,在聂卫平之后领军中国围棋。近期马晓春热心参与人工智能围棋活动,今年上半年就曾在福建云计算中心助阵人机联棋赛,前不久还在华山参与人机大战。 出生于台湾南投市的王立诚在日本开创了属于自己的时代,曾斩获棋圣、亚洲杯等众多头衔,并多次杀入世界大赛决赛,夺得过LG杯和春兰杯世界冠军。 罗洗河当年曾“串烧”韩国列强,弃三劫循环鬼手大转换淘汰崔哲瀚,最终扳倒石佛李昌镐勇夺三星杯,从此终结李昌镐“铁门”垄断,一时传为佳话。如今罗洗河已是腾讯人工智能“绝艺”团队一员,亲手参与“造神”,对人工智能有着独到理解。 参加活动的人工智能围棋包括CGI、天壤。由台湾交通大学吴毅成教授团队研发的围棋人工智能“CGI”近来风头正劲,上半年在福建云计算中心的人工智能物联网大会,CGI搭档黑嘉嘉战胜各地好手登顶,接着在中国围棋大会连克DeepZenGo、绝艺、天壤等全球强手杀入决赛,可惜官子失误负于DeepZenGo屈居首届世界智能围棋赛亚军。 来自上海的天壤无疑是人工智能界冉冉升起的新星,公司成立仅一年多,在人工智能围棋领域突飞猛进,首届世界智能围棋赛中多次屠龙被冠以“死活达人”称号,神勇杀入四强,最终负CGI、绝艺获得第四名的佳绩。 同时,大赛还特别选择“永不落幕”的高端智能制造展示交易基地——厦门机电设备展示交易中心作为分赛场,在这个由厦门市委市政府着力打造、整合了全球高端智能制造资源的自贸试验区厦门片区重点平台建设项目里,让大家更切身地感受到人工智能产业的发展,将如何在工业制造技术升级、驱动智能制造发展等方面发挥重要作用,将如何更加深入地影响每个人的生活。 海峡两岸(厦门)文化产业博览交易会(简称“海峡两岸文博会”)是大陆地区唯一以“海峡两岸”命名并由海峡两岸共同主办的综合性文化产业博览交易会,以“一脉传承•创意未来”主题,以“突出两岸、突出产业、突出投资、突出交易”为宗旨,以促进两岸文化交流为目的、推动两岸文创产业的合作和落地。[详情]
第90届奥斯卡临近,关于2016年首次围棋人机大战话题的纪录片《AlphaGo》确定将进军本届奥斯卡,参与最佳纪录片的角逐。 今年4月在纽约翠贝卡电影节首映后,纪录片《AlphaGo》赢得一片好评!在IMDB(互联网电影资料库)评分一度高达9.8分。这无疑给了DeepMind团队以及该片的导演格雷格(Greg Kohs)巨大的鼓舞。 与李世石的人机大战是主题 由于字母A排序靠前,在长长的纪录片名单中一眼便看到了《AlphaGo》,而总共参与竞争最佳纪录片奖项的作品达到170部,竞争不可谓不激烈。 中国纪录片《二十二》在列,还包括《幽灵之城》、《叙利亚的哭声》、《脸庞,村庄》、《伊斯坦布尔的猫》等已取得一些荣誉或提名的口碑佳片,以及《我们诞生在中国》、《追逐珊瑚》、《纽约公立图书馆》、《Gaga:Five Foot Two》、《电影配乐传奇》、《The Rape of Recy Taylor》等大热影片。 15部短名单将于12月宣布,1月23日提名仪式将宣布最终五部入选名单。本届奥斯卡颁奖仪式将于2018年3月4日举行。 此外,中国内地确定选送《战狼2》参与第90届奥斯卡最佳外语片角逐。 竞争最佳纪录片的170部作品 (文玄)[详情]
来源:弈客围棋 作者:白石勇一 翻译:王振飞 继续介绍AlphaGo Lee对Zero的第2局。 1图(实战) Lee执黑先行。局面下至黑△三间高夹。白△一子接下来如何处理,是现下的当务之急。另外令我有些疑惑的是黑△这一手的攻击距离,难道不是夹击的更严厉一些更好吗? 2图(变化图) 白1是我的第一感。接下来双方大致下至白5。 如果这样下,黑棋实地不差,估计Lee是对这个变化图满意的才会选择三间高夹的吧。Lee原本就没有攻击白棋的意思。 3图(实战) Zero应该是看出了Lee的意图,实战选择了惊人的下法。 五路肩冲! 想必大家对于第一次人机大战时,AlphaGo Lee五路肩冲李世石的那一局还多少留有印象吧。完全没有学习过人类围棋知识的Zero居然也下出了五路肩冲,实在令人有些震惊。 Zero的意图大概是希望在黑△一子上借力,给白△输送援军。 如果黑△一子是在三路上,那么我觉得会选择四路肩冲的职业棋手也不在少数吧。但是对于四路也敢于大胆肩冲,这对于棋手来说确实还是需要勇气的。 习惯了AlphaGo的五路肩冲后,接下来的招法更是令人震惊。 4图(实战) 黑1挖,寻找行棋的步调。白2脱先飞压亦属正常。 白棋接下来的4,6,8居然就这样把五路肩冲的白×给弃掉了。感觉白棋行棋思路非常的不连贯,效果却非常好。(苦笑)接下来黑棋角上还得补一手,否则A位被白一尖,角上还没活。 感想:AlphaGo Lee当初展现的大局观就已经令我印象深刻,而现在的AlphaGo Zero显然更胜一筹。Zero在本局展现的非凡的大局观和灵活性值得我们职业棋手学习。[详情]
来源:量子位公众号 作者:安妮 近日,深度学习领军人物、卷积神经网络的创作者之一Yann LeCun接受了外媒采访。作为Facebook人工智能研究院(FAIR)的院长,LeCun表示距离AI的智力水平超过一名人类婴儿还有很长一段时间。 “如果媒体在报道AI时不用终结者的配图,我会很高兴。”LeCun表示。 如果一个学术大牛表示目前离超级人工智能还远得很,我们是不是应该听听他的想法。对此,The Verge专访了LeCun,量子位将对话实录编译整理如下: 问: 最近Facebook机器人“创造了自己语言”的新闻报道火热,其中有很多与实际研究不符的错误理解。对比过去几年,你觉得这类报道变多了还是变少了? LeCun: 少了,媒体人对要讲的故事更了解了。过去你会看到无终结者不AI的情况出现,媒体100%会在报道中插入终结者的配图……现在这种状况只会偶尔发生,是好事。 问: 当这种错误报道出现时,你想对公众说什么? LeCun: 我在公开演讲时反复提到,我们离创造真正的智能机器还很远。现在你能看到所有AI的本领——自动驾驶汽车也好,医学影像中的落地也罢,即使是AlphaGo在围棋比赛中拿到世界第一——这些都是非常窄层面上的智能,是在某些可以大量收集数据情况中为了特定功能专门训练的。 我不是想将DeepMind在AlphaGo上的研究影响往小了说,而认为是人们将AlphaGo的发展解读为机器智力发展的重要过程是不妥的。这两者完全不是一回事。 不是有一台在围棋上能打败人类的机器,就会有智能机器人满街跑,这是两个完全独立的问题,前者对后者可能几乎没有影响。 在这里我想再次重申,距离机器像人和动物一样了解世界还有很长时间。是的,在某些方面机器确实表现超人,但在一般智力因素上,机器的“智商”甚至赶不上一只老鼠。所以很多人过早考虑了某些问题…… 当然,也并不是说我们不应该考虑,但至少从当前到发展中期水平时人类是安全的。我承认AI确实存在危险,但他们不是终结者啊!╮(╯▽╰)╭ 问: DeepMind在AlphaGo中创造的算法也可以应用到其他科学研究中,比如蛋白质折叠和药物研究。你认为在其他地方应用这种研究容易吗? LeCun: AlphaGo中用的是增强学习。在游戏中,这适用于有少量离散动作的情况。因为它需要很多,很多,很多的试验来运行复杂的东西,所以比较有效。 AlphaGo Zero在几天内下了数百万盘围棋,可能比人类在发明围棋以来的大师下得还要多。因为围棋是个非常简单的环境,可以在多台计算机上以每秒数千帧的速度模拟它,所以行得通……但在现实世界中,你无法以比实时更快的速度运行真实的世界,所以行不通。 要想摆脱这种局面,唯一的方法就是让机器通过学习建立内部的世界模型,这样就能超过现实提前预测世界。目前我们缺乏的就在于如何教机器构建世界模型。 比如说学开车,人类有足够好的系统模型,就算是初次开车,也知道我们需要在路上驾驶汽车,不要让车坠入悬崖或者撞树。 如果我们在模拟器中只用增强学习训练汽车,那么在撞树4万次之后它才知道这是错误行为。所以,声称只用强化学习就能提升机器智力是错误的。 △ Facebook在美国普林维尔的数据中心 问: 你是否认为,AI缺少超越它目前局限的基本工具?AI先驱Hinton最近提到这段话,表示当前领域内太过依赖“把它全部扔掉,然后重新开始”的方法。 LeCun: 我认为Hinton有些过度解读了,不过我完全认可“我们需要更多基础的AI研究”。例如,Hinton喜欢的模型之一是他在1985年提出的玻尔兹曼机(Boltzmann machine)。他认为这个算法很好,但实际应用中并不是很有效。 我们想找到兼具有玻尔兹曼机的简单和反向传播的效率的机器。这就是Bengio、Geoff、我和很多人在21世纪初重新开始深度学习研究以来做的事。 让我们有点小惊讶的是,最后在实践中反向传播和深度网络配合得很好。 问: 所以,考虑到AI研究中的大变革,你认为在短期内什么对消费者来说是最重要的? LeCun: 我认为虚拟助手是件大事。现在的虚拟助手完全是照本宣科,尽管在客服等场景下有用,但这让创造机器人这事乏味、昂贵且易夭折。 △ Facebook在虚拟助手的研究上投入了大量精力,但还远远落后于Alexa等竞争对手 下一步的重点是让系统有更多的学习能力,也是我们在Facebook的研究方向。想象一下你有一台可以读取长文本的机器,读完后能回答任何相关问题,是不是个很实用的功能呢? 到此程度的重点是机器和人有同样的背景知识,也就是常识。但除非我们能找到让机器通过观察了解世界是如何运作的方法,否则无法实现这个想法。这里指的观察是仅仅通过看书或者看视频了解整个世界。 这是未来几年的关键性挑战,我称之为预测学习,有人称为无监督学习。 接下来的几年,随着虚拟助手越来越实用,越来越不让人失望,这些任务将有持续进展。机器将有更多常识去做设计师编写的程序之外的事情,这也是Facebook非常感兴趣的内容。 — 完 — [详情]
来源:弈客围棋 作者:白石勇一 翻译:王振飞 最近我BLOG的阅读者增加了不少啊,除了井山再次夺取七冠的新闻舆论外,主要就是AlphaGo Zero的原因了吧。 今天介绍AlphaGo Zero与AlphaGo Lee之间的第1局较量。AlphaGo Lee指的是与李世石九段进行第一次人机大战时,AlphaGo的版本。 1图(实战) Lee执黑先行。 对黑1挂角,Zero应以白2尖顶这一手颇为颠覆。过去我们一般都是认为只有在攻击黑棋这一子时才能先尖顶。直接尖顶黑棋,帮黑棋走厚了是不好的。但是既然Zero这样下了,恐怕这一局部下法很快会流行起来吧。(译者:中国古棋里其实是有大量星位挂角尖顶了再大飞或者小飞的下法的。) 我还蛮期待职业棋手们大量尝试这一局部定型的体验。 2图(参考图) 局面下至黑△。 黑×一子是棋盘上非常显眼的大场,在左边打入无疑是很有吸引力的。 所以白1是很容易想到的第一感。那么黑2反夹。 白3虽然可以吃掉黑×一子,但其实并不大,黑棋就简单弃掉,再抢黑10,局面明显是黑棋好。 3图(参考图) 那么如果白1挂角呢? 黑2一定会夹击,又是夹击白棋,又可以拆边,这是一石二鸟的好手。接下来大致双方下至黑6。这棋白棋也有攻击落空之感。 4图(实战) 点三三!点三三! AlphaGo Zero也是同样热爱点三三啊。 学习了人类棋谱的Master热爱点三三,完全不受人类围棋影响的Zero居然也是如此的热爱点三三。看来点三三是围棋的真理之一也未可知。 老实数,虽然最近看了无数的点三三,但我还是不认同布局上来就点三三的下法,也不想模仿和尝试AlphaGo的这一下法。但是看到这盘棋的点三三时,我还是深以为然的。 5图(实战) 下至黑9,白10再打入。此时黑已经没有心情再在A位夹击白棋,实在太小也太重复了。 感想:先帮对手造出厚势,使得之后的战斗很顺畅。这本是一个矛盾的想法,但却在Zero身上绝妙地成立了。AlphaGo的围棋真是奇妙啊![详情]
来源:找借口安静公众号 原址:http://toyokeizai.net/articles/-/194179?display=b 原题:最新囲碁AI「Alphago Zero」に畏れは無用だ 人が問題を解く方法とは根本的に違う 作者:本田雅一(IT行业记者) 谷歌旗下的“DeepMind”团队在10月28日,该团队公布了最新的围棋人工智能程序“AlphaGo Zero”。 这一次,“AlphaGo Zero”并没有采用之前学习人类棋谱进行深度学习的方法,而是完全通过自身来提高自己的实力。英国科学杂志《自然》杂志上表示,它的实力压倒性地高于AlphaGo的改良版“AlphaGo Master”。 仅用了3天时间,就成为了最强棋手 人们经历了几千年对围棋的创新和积累,演变出了如今的定式。但是这次的“AlphaGo Zero”并没有给它导入这些的信息,全靠自我对局摸索出最佳手段的学习方法,通过3天内进行了500万盘对局提升自己的实力。 仅用了3天就成为了最强棋手,不少人看到AlphaGo Zero的实力之后表示“人工智能终于超过了人类”等让人产生畏惧的评论,那么事实究竟是怎么样的呢? 诚然,DeepMind团队在这个领域上获得了巨大的成果。但是即便达成了如此高的成就,依旧离不开人类的智慧和时间的积累。我们用不着对人工智能产生惧怕心理,人工智能今后是我们创造新发现,新发明的工具,人工智能的技术今后可以在社会上发光发热。 根据《自然》杂志上的内容,AlphaGo Zero在和击败职业顶尖棋手而震惊全球的AlphaGo的交手中百战百胜,在和AlphaGo的改良版“AlphaGo Master”的交手中100战也收获了89胜。“AlphaGo Zero”这个程序从零起步,通过3天500万盘的自我对局,从自己的招法中反复进行学习。之前AlphaGo是通过学习人类的棋谱提高自己,这一次则采用了自我对局来提高自己的水平。 虽然收获了一个非常了不起的成果,但是“令人畏惧”的是,电脑就像是自己理解围棋,从中收获灵感,然后再发明新的下法。实际上“AlphaGo Zero”呈现给我们的定式里,很多都和人类重复的,只不过有一部分是全新的定式。 那么,人工智能的发明能力是不是已经超过了人类了呢?是否对众多从事创意职业的人产生了威胁,这类恐惧发生在我们身上其实一点也不奇怪。更何况这个事情已经呈现在我们面前了。 电脑的计算能力在半导体技术和云技术的发展下急速发展,才使得“AlphaGo Zero”可以在短时间内反复地进行自我对局和自我学习。我们得到的最基本的信息是——电脑程序在进行自我学习,即便不用找出最佳的一手棋,所有的定式都可以从自己身上挖掘出来,随后这个程序之后以惊人的计算速度反复进行操作。这是新闻里的主要内容。 但是,电脑并非可以客观地理解围棋,或者收获对围棋的灵感进行对局。 将围棋的每一手棋,根据局面上的变化进行评价和数字化,并写成程序的还是我们人类。引入自我学习的强化技术,目的还是把人类写的程序能更加顺利,更好的进行运作下去。“AlphaGo Zero”只不过是在很多运行错误的基础上进行调整,然后找出最好的一手棋罢了。 至于“AlphaGo Zero”为什么能发明新定式。人工智能和人类最大的不同点是,它不会拘泥于某种观念在进行思考。那些打破常规,难以想象的招法,人工智能都给我们进行了尝试。也就是说,人工智能发明出来的棋,是我们压根没有想到的棋。这个现象在将棋界的人工智能上也得到了体现。 电脑并不是制造解决方法的玩意 去年“机器人能否进入东京大学”的项目结束,这件事情各位是否知晓。这是由国立情报学研究所的新井纪子博士,和其他民营企业以及大学里的研究生参与的项目。他们让人工智能参加日本的高考,并在东京大学的考试中以A的分数通过了考试,我们当时也采访了担任人工智能世界史B考试的日本优利公司(偏差值达到66.5)。 很多人认为,电脑的解题方式是经过怎么样的思考,才推导出正确的答案。实际上电脑事先将高考里有可能考到的题进行了分类,程序员根据分类写出不同的解题方法的代码,编成程序之后,再把教科书的内容和维基百科的内容融合起来进行学习。 另外,这个程序有很多种类,也就是说很多解题方法也被写了进去,通过各种判断找出正确的答案。电脑并非先理解这题的意图再做题,只不过是找到一个正确率或许比较高的答案作为这道题的解答而已。 一些细节在这里就不多说了,但是解决问题的人还是程序员,也就是人类,电脑自己依旧没法给自己创造解题方法。人类解决问题,然后人工智能找到正确的答案,这个观点本身就是错误的。 那么,我们再把话题回到AlphaGo Zero身上。 AlphaGo Zero给我们证明的应该是,我们把人工智能作为更快的找出正确的解答的道具,然后再进行下一个步骤。即便我们不提供人工智能人类发明的定式等基本信息,它依旧可以计算出比较准确的答案,探索能力可以说是达到了超出想象的高度。 人类将解决问题的出发点,思考方法和解决方法写成了程序。如果把推测和思考方式网正确的方向进行发展的话,就可以像DeepMind团队所说的那样“人工智能不会受到人类知识的制约”了,我们可以期待今后将会更加自由,更加难以想象的方向发展下去。 人工智能将会作为人类解决问题的工具,可以说是迈出了一大步。所以说,我们没有必要畏惧人工智能。 [详情]
新华社西安10月24日电(记者郑昕)自从去年围棋人工智能系统“阿尔法围棋”(AlphaGo)在与韩国棋手李世石的对决中“一战成名”之后,围棋界各种人类棋手与人工智能的对弈就层出不穷。25日至27日,又有一场对抗即将在西岳华山进行。不同以往,这次是人脑对人脑、人工智能对人工智能、人脑对人工智能的“大乱斗”,别开生面的赛制更是吸引到曾与“阿尔法围棋”大战过的李世石与柯洁前来。 此次中国华山国际围棋大会的各个比赛单元均看点纷呈。目前等级分世界第一的柯洁九段将从25日下午开始,在华山脚下的华山客栈接受李世石九段、周睿羊九段和河野临九段等中日韩三国围棋高手的挑战。决赛将于26日下午在武侠小说中华山论剑的北峰之巅进行。在四周皆为悬崖的狭小平台上,两名棋手开枰论道,思绪如剑戟缠斗,这与金庸、古龙笔下的高手对决相比另有一番精彩。 24日下午来到比赛场地的柯洁一改上周在西安进行围甲联赛时的疲惫,身着一袭黑色闪亮西装登场的他看上去十分精神。“我十分期待在华山上的比赛,我也希望能在华山上转一转,”心直口快的柯洁说,“围棋界比赛需要有意思的赛制和环境,就像这次特殊的比赛环境,希望我能够发挥出好的水平。” 在“人机大战”层面,中国棋手马晓春九段将作为人类的代表,在人工智能围棋邀请赛迎战清华大学“神算子”、韩国“石子旋风”、法国“Golois”,同时这3种人工智能系统也将捉对厮杀。而作为清华大学“神算子”团队的成员之一,世界围棋盲棋高手鲍橒也将特意单独作战,与一名从本土棋坛中选出的围棋高手对战。 鲍橒曾在国内某知名智力测试节目中盲眼走通127个单元组成的蜂巢迷宫,并称其难度不如下围棋盲棋。在26日的专场比赛中,他将会在棋盘的横纵两边各标记1到19的数字,或背对棋盘,或用布条蒙住双眼,借助另外一名围棋选手,通过坐标信息指令下棋。 据了解,在激烈的赛事之外,此次主办方还设置了“人工智能与围棋、人类未来”高峰论坛,体育、科技、文化界人士将纵论人工智能等科技进步给中华传统文化、人类未来世界带来的机遇和挑战。[详情]
来源:弈客围棋 作者:蓝烈 10月21日上午,第8届“国轩-国学杯”第九轮比赛于合肥庐江汤池镇的国轩大酒店进行,王琛战胜马天放以九轮全胜的战绩获得了冠军。赛后王琛接受了弈客围棋的专访。 -第一个问题,你八连胜后最后一轮碰到马天放,有没有感觉到“连亚”的心魔? 王琛:“确实是有一点。但其实,这一次我的压力并不是特别大。明天不是陈毅杯决赛吗(第7届陈毅杯决赛三番棋,对手是白宝祥)?我差一点不来打国学杯了。我只是开赛前一两周的时间才决定来打国学杯,当是为陈毅杯练练手。但没想到这次发挥还不错。”-记得你以前拿了国学杯以后紧接着又拿了陈毅杯。 王琛:“那是六年前的事情了(第2届国学杯)。”-那你是不是觉得这次也会(先拿国学杯后再拿陈毅杯?注:没等记者说完,王琛就打断)。。。。。。 王琛:“没有没有,因为陈毅杯决赛的对手白宝祥是非常强的棋手,虽然我现在状态还可以,但觉得胜负还是五五开。不过我先拿到了国学杯的冠军,后面的压力可能会小一点。” 王琛再获国学杯冠军 -为了这次采访,我重新读了一遍你的《虐心之旅》(弈客围棋连载),你说快“十连亚”了,你能数出都那些亚军吗? 王琛:“肯定有十个了。我去年就是晚报杯和陈毅杯的亚军,去年还有一个,具体忘记了,总之去年是三个亚军。然后今年晚报杯亚军、丰城杯亚军,黄河杯亚军,还有山东富地源置业杯亚军。此外有贵州杜鹃花杯亚军。这次国学杯也很危险,如果最后一轮输了(对马天放),好像也是亚军。”-我读《虐心之旅》,能感觉到你正在审视自己,磨砺心境。 王琛:“相比上大学的时候,我对成绩的渴望没有那么强烈了。我现在最多是想保持一个稳定。而今年,我整体成绩其实还是稳定的,我也是比较满意,状态也是可以。但是,亚军拿得多了,总归是不甘心,感到有点遗憾。这次比较意外,差点就不来了嘛。好在来打国学杯后,发挥的还是不错,九盘棋内容上看,都是比较顺利的。” 第九轮结束后裁判数棋,马天放白子共175枚 -最后一盘对马天放的棋怎么样? 王琛:“这盘棋开始他肯定是不太好,不过后面我优势意识太强了,结果一度下得非常乱。最后对手在读秒中判断出现了失误。”-在你们“天王”之间,比如你在《虐心之旅》中提到的7段俱乐部等等,比如“狐狸”(胡煜清)、苏广悦等等,你们之间的关系非常要好。但是业余比赛,最后争冠亚军的往往都是你们。但是“伙伴”之间,关键比赛碰到一起而且输了,心里肯定会非常难受。那你们是怎么处理这种心态问题? 王琛:“因为大家成绩都比较稳定,总会有关键棋相互会碰上。比如说我和胡煜清之间,正式比赛哪怕没有一百盘,至少六、七十盘是已经有了。因为相互之间关系很要好,而且太熟了,所以输棋固然很难受,但稍微缓一两个小时晚上又能一起出去吃饭喝酒。我觉得这也是业余比赛的一大魅力,朋友之间下棋很愉快,输了也不是那么难受。”-国学杯期间,出了震撼性的新闻,即“阿尔法零”三天就走完了人类围棋四千年的历程。你对此有什么看法? 王琛:“其实,并没有“阿尔法狗”赢李世石那么震撼。一是我们已经习惯了有AI可以参考和陪练。再则人工智能进步的速度,完全在可理解的范围内,没有什么可惊讶的。至于它的棋,想完全理解是困难的,所以我抱着的态度是欣赏,没有盲目去模仿。有的时候,也可以作为参考。” 业余“天王”们 -对于你们“业七”俱乐部,阿尔法的下法技术上对你们有影响吗? 王琛:“阿尔法狗于我们的主要影响,是布局上的一些招法。而计算是自己锻炼出来的东西,阿尔法狗是提供不了什么帮助。而人脑的容量毕竟有限,总归算不过AI。所以计算的领域,其实和以前没有什么两样,该怎么下就怎么下。而我们借鉴和学习的是布局和棋盘上的虚的部分。”-苏广悦第八轮对唐崇哲,走了两步非常漂亮的碰,你看到棋谱了吗(注:第八轮赛后,记者问苏广悦,白46、48两步碰是不是借鉴了阿尔法狗的下法?苏广悦明确回答:是)? 王琛:“对,我看到了。苏广悦平时在家就用配置相当高的电脑下载了“丽拉”(比利时围棋AI,免费提供下载),然后天天和“她”下。苏广悦非常推崇AI,而且模仿AI的招法。今年他的成绩确实变好了(半目击败王琛获得黄河杯冠军,加入“业七”俱乐部),我觉得与此有关系。” 苏广悦白46、48 (采访结束后记者问苏广悦。在家配了什么高配置机器?苏广悦说:1080ti显卡的机器。记者问:和“丽拉”的胜负如何?苏广悦说:胜负各半。也就是说:AI已经实际影响围棋界,将来围棋培训和教育会与AI紧密联系在一起,进而带动围棋应用AI的竞争。)-我采访国学网总裁尹总(尹小林),他说:因为AI的影响,未来职业制度会消失,你对这个问题有什么看法(注:国学网总裁尹总说:今年是业余围棋的元年。对尹总的专访随后整理发表)? 王琛:“我认为不会。我觉得职业制度完全消失,就算发生也是以后的事情。我觉得我不一定能看到这一天的到来。而且,虽然AI水平高,人类确实也下不过,但人类也有AI没法取代的东西。我认为围棋不该是没有感情的、冷冰冰的,只靠计算的东西。我觉得有血有肉的人下起来更紧张和刺激,也更有意义。AI的出现,确实会对职业棋手产生一些冲击,但围棋的本质,我认为就是人与人之间的交流,就是“‘手谈’。” 王琛在比赛中 -你明天就会下陈毅杯了。无论冠军还是亚军,你会不会接着写心境的篇章?看你赛前写的《虐心之旅》,我觉得对你这次夺冠帮助很大,明显是洗练了心境。 王琛:“应该会。进入下半年,我意识到我已经25岁了。而我对自己的规划是30岁以后逐渐减少参加比赛的次数。所以,我决定趁着这几年状态还可以的时候,尽量把自己比赛、心路历程等记录下来。无论给别人看,还是给自己看,我觉得都蛮有意义。”-好,祝你再拿冠军。 蓝烈[详情]
文章来源:彭圣才微博 关于AlphaGo Zero,相信读者们过去两天已经被各种刷屏了。 AlphaGo自从 5:0 战胜樊麾惊艳亮相以来,差不多每隔半年就要来个大新闻,而我,作为一名曾经从事人工智能的围棋爱好者+产品经理,每一次我都及时出来蹭了热点,这一次也不例外。 所不同的是,前几次都是为职业棋手站台,文章的主旨是为职业棋界加油打气,比如这篇:职业棋手,你们依然是我们这个星球上最聪明的人,还得到了柯洁 的10元打赏。而这一次,职业棋界已经坦然接受了这个事实,并且十分虚心的接受阿老师的指导。 李世石输给AlphaGo的时候,我的某位职业棋手朋友还不大能接受这个事实,甚至表示棋谱有诸多可疑之处,网上甚至有些流言说李世石放水啊,谷歌和私下协议不 许打劫啦,等等。当时力挺AlphaGo的李喆六段还被职业棋界的不少人视为叛徒。然而,终究AlphaGo一而再再而三的证明了自己,刷新了我们的认 知,也终于平息了一切质疑。今天,包括柯洁在内的职业棋手,普遍表示AlphaGo 比自己至少强2子以上。更有人感叹,当年藤泽秀行老先生说:棋道一百,我只知七。 在今天看来,也许并非谦辞。 虽然完全接受了AlphaGo存在的职业棋界,这次已经非常坦然,然而,在AI界,这次的震动却丝毫不小。原因无他,这次发表在Nature上的这篇文章叫: Mastering the game of Go without human knowledge 围棋,英文称为Go,这个标题的意思就是 在没有人类知识的前提下掌握围棋。 相信这几天大家被各种刷屏文都科普过了,所谓的“无师自通”,“左右互搏”等等,在此我就不重复了,说说几个我觉得最神奇而有趣的体会: 殊途同归 在 Nature的论文中,谷歌公布了AlphaGo 在学习不同阶段的一些成果,非常有趣的是,虽然完全没有人类的干预,但是机器依然学会了人类流传下来的一些定式。 当看到神功大成的AlphaGo 依然开局第一手走在角上的时候,人类大约松了一口气。 至少 “金角银边草肚皮”还没被颠覆,之前已经有人在YY,也许第一手的最佳招法在天元呢。我自己看到论文中的这两幅图的时候,百感交集。 左边这个定式即使在今天,依然是职业棋界流行的定式,可以看到AlphaGo在训练到10个小时左右的时候,就学会了这个定式。 而右边那个是著名的小雪崩定式,大约在15个小时的时候被习得,然而到70小时以后,这个定式就几乎不再出现了,说明被机器摒弃了。 在之前的AlphaGo的版本中,人类已经知道这个变化不好,所以现在职业棋手也基本没人下了。 这样的殊途同归十分感人,时隔数百年的人类先后用不同的方法得出同样的结论,这种感觉十分奇妙。 关于征子 “征子”是围棋的一个十分基本的战术,基本小朋友启蒙阶段最开始的几节课就会学到这个,然而,AlphaGo非常晚才学会这个最基本的战术。从时间线上来说, 大致可以说水平几乎已经达到或者超过李世石的时候,它却还不会征子! 这是一个非常神奇的发现。 也就是说,虽然彼时这个机器的实力已经非常强了,可是由于不会征子,如果把这个时期的机器拿出来跟人对战,那么人类完全可以利用这个缺陷,故意利用机器不 懂征子产生误判,从而战而胜之。不过由于机器是自我学习,左右互搏,所以并不会刻意利用自己这样的缺陷。 人类拖了AI的后腿 一 个更有趣的事实是,一年前的版本,对于这样的一些缺陷,会通过“修bug”的方式,把一些较为基本的围棋知识,通过人工干预的方式来有意识的让机器更早的 习得类似的技能。 腾讯的“绝艺”团队,聘请了世界冠军罗洗河 来担任顾问,在很短的时间内就达到了李世石版本的AlphaGo水准。 当时我就论断,此举虽然短期进步神速,但是由于机器被越来越多的接受人类师傅的指导,其天花板将难以超越人类太多。 果然,今天的“绝艺”总训练量已经超过数十亿盘,但是水平再也难以进一步提升了。 我想,这才是这篇论文能荣登Nature的最大意义,即 AlphaGo团队证明了,完全不需要人类的干预的情况下,机器虽然在某些基础理念上短期内不如人类,但是最终进化出来的水平远远超过人类,也超过以人类 棋谱作为训练集的机器水平。另一个略显讽刺的事实是,最早人工智能界为了检验自己的AI水平,设立了一个以人类职业高水平棋手对局库为基准的测试集,每一 个新研发的AI,会用这个测试集来计算,以预测出该对局库中下一手的成功率来作为一个衡量标准。 最新版的AlphaGo Zero,虽然在对战中已经可以90%的概率战胜之前的Master版本,但是在这个测试中,却明显落后于Master…… 我想,谷歌是用这种方式,向世界宣布,从此以后,成功预测人类的下一手,已经不再适合作为围棋AI的评估标准。柯洁 在微博上说的那句:“原来是我们拖了后腿啊”也并非虚言。[详情]
日前,阿尔法围棋新闻登上辽宁卫视“说天下”栏目。[详情]
文章来源:羊城晚报文/图羊城晚报记者葛万里 近日,人工智能使棋坛再次震动。名为AlphaZero(暂译“阿法元”)的机器系统以大比分战胜了AlphaGo(“阿法狗”),且设计理念不依托于人类成果,完全靠自我对弈学习下棋。这不禁使人又想起此前“阿法狗”横扫多位顶尖棋手时,中国围棋“棋圣”聂卫平所感叹的那句:“阿老师的招太牛了!” 聂卫平九段,是羊城晚报的老朋友。听说今年是羊城晚报创刊六十周年,他连赞“了不起”,并向羊城晚报记者表示衷心祝贺—— “羊城晚报对围棋的宣传是做得很不错的,对围棋的支持是一贯的,我们围棋界对羊城晚报有感恩之心。现在(羊城晚报)已经六十年了,非常了不起。希望羊城晚报不忘初心,砥砺前行,更上层楼。” 在羊晚首开评球专栏,一炮而红 说起聂卫平与羊城晚报的深厚情谊,却是源自其所喜爱的足球。 老聂是棋界有名的足球迷。每逢世界杯和欧洲杯大赛,他通常会熬夜观看电视直播。1998年,聂卫平来羊城晚报做客,两杯烧酒下肚,性格豪爽的老聂便答应在羊晚开辟评球专栏,对全国足球甲级联赛“指点江山”。这也是他首次在国内主流媒体,对中国足球进行一个赛季的公开评球。 聂卫平评球,和他评棋一样,言词犀利,观点鲜明,不会说诸如“双方都有机会”这类模棱两可的话。因此他的一些预测,说对了鲜被人记住,说错了却总招人调侃,不少球迷戏称老聂和足球巨星贝利一样,嘴巴有“毒”。 不过客观而言,聂卫平对足球是有独到见解的。他看球和看人的眼光,颇具“专家级”水准。 比如1998年的中国足球甲A联赛,聂卫平就大体准确地预言了哪几支队能跻身三甲、哪几支队可能降级。不俗的预测“命中率”,让首试身手的他一炮而红,随后不仅在羊城晚报继续开设专栏,点评1999年赛季的甲A联赛以及2000年欧洲杯、2002年世界杯赛,其他媒体也陆续邀请他做评球嘉宾。“聂氏风格”评球,很快就在球迷中受到追捧。 前年,羊城晚报记者采访聂卫平,聊起风头正劲的广州恒大队时,他对恒大此前不久签下的保利尼奥赞不绝口,而对引进的另一名球星罗比尼奥,却十分不看好。在保利尼奥的作用尚未充分凸显的当时,老聂就有如此判断,足见其眼光是很“专业”的。后来,保利尼奥成为恒大队的绝对主力,被定为“非卖品”;而罗比尼奥只踢了半个赛季,便悄无声息地背包走人了。 和羊晚记者谈“阿法狗”:“颠覆认知” 自从去年举世瞩目的围棋人机大战后,人工智能便成为围棋界的热点话题。 2007年,第三次来羊城晚报做客的聂卫平,在与记者的访谈中,曾预言,电脑围棋想超越人类绝无可能,要想战胜人类那也是一百年后的事情。“因为围棋是如此深奥复杂,人类经过几千年摸索,到现在还有很多地方没搞明白。” 去年,由谷歌公司研发的AlphaGo围棋,首次正式向人类的代表、韩国围棋世界冠军李世石九段发出挑战时,聂卫平在战前仍“断言”:“人类100%会取胜。电脑战胜人类这种说法,完全是忽悠。” 当这场人机大战以AlphaGo直落三盘取胜后,老聂“知错就改”,坦承电脑的强大实力给了他震撼性的教育:“我现在已完全扭转了之前的看法。我要脱帽向AlphaGo致敬。” 不久前,聂卫平在接受羊城晚报记者专访时再次谈到了人工智能,他甚至用“惊天动地”来形容:“AlphaGo进入围棋界后,影响是巨大的。惊天动地啊!很多职业棋手对围棋的认知都被它颠覆了!”他表示:“我们已经不能像以前那样,还一直认为自己是老大,现在是要好好向人工智能学习了。” AlphaGo在对局中展现出的惊人大局观,也让素以大局观闻名的聂卫平叹服:“它的大局观和布局构思非常好,让我对自个儿以前所掌握的很多围棋知识都表示怀疑。” 人工智能对提高人类的围棋水平有很大帮助,不过,聂卫平对现在很多职业棋手一味模仿AlphaGo的招法也提出严厉批评:“依葫芦画瓢没有用,人工智能的一些想法、招法人类根本看不懂,也没有办法去学,越学反而越糟糕。”[详情]
策划|吴非绘制|铁蛋公主相关阅读:史上最强AlphaGo横空出世,不靠任何人类经验完爆旧版,柯洁感慨”人类太多余“往期漫画回顾:诺奖黑历史:他把很多人治成了傻子[详情]
作者:葛熔金 在金庸的小说《射雕英雄传》里,周伯通“左手画圆,右手画方”,左手攻击右手,右手及时反搏,自娱自乐,终无敌于天下。 现实世界中,亦有这么一个“幼童”,他没见过一个棋谱,也没有得到一个人指点,从零开始,自娱自乐,自己参悟,用了仅仅40天,便称霸围棋武林。 这个“幼童”,叫阿尔法元(AlphaGo Zero),就是今年5月在乌镇围棋峰会上打败了人类第一高手柯洁的阿尔法狗强化版AlphaGo Master的同门“师弟”。不过,这个遍读人类几乎所有棋谱、以3比0打败人类第一高手的师兄,在“师弟”阿尔法元从零自学第21天后,便被其击败。 10月19日,一手创造了AlphaGo神话的谷歌DeepMind团队在Nature杂志上发表重磅论文Mastering the game of Go without human knowledge,介绍了团队最新研究成果——阿尔法元的出世,引起业内轰动。 虽师出同门,但是师兄弟的看家本领却有本质的差别。 “过去所有版本的AlphaGo都从利用人类数据进行培训开始,它们被告知人类高手在这个地方怎么下,在另一个地方又怎么下。” DeepMind阿尔法狗项目负责人David Silver博士在一段采访中介绍,“而阿尔法元不使用任何人类数据,完全是自我学习,从自我对弈中实践。” David Silver博士介绍,在他们所设计的算法中,阿尔法元的对手,或者叫陪练,总是被调成与其水平一致。“所以它是从最基础的水平起步,从零开始,从随机招式开始,但在学习过程中的每一步,它的对手都会正好被校准为匹配器当前水平,一开始,这些对手都非常弱,但是之后渐渐变得越来越强大。” 这种学习方式正是当今人工智能最热门的研究领域之一——强化学习(Reinforcement learning)。 昆山杜克大学和美国杜克大学电子与计算机工程学教授李昕博士向澎湃新闻(www.thepaper.cn)介绍,DeepMind团队此次所利用的一种新的强化学习方式,是从一个对围棋没有任何知识的神经网络开始,然后与一种强大的搜索算法相结合,“简单地解释就是,它开始不知道该怎么做,就去尝试,尝试之后,看到了结果,若是正面结果,就知道做对了,反之,就知道做错了,这就是它自我学习的方法。” 这一过程中,阿尔法元成为自己的“老师”,神经网络不断被调整更新,以评估预测下一个落子位置以及输赢,更新后的神经网络又与搜索算法重新组合,进而创建一个新的、更强大的版本,然而再次重复这个过程,系统性能经过每一次迭代得到提高,使得神经网络预测越来越准确,阿尔法元也越来越强大。 其中值得一提的是,以前版本的阿尔法狗通常使用预测下一步的“策略网络(policy network)”和评估棋局输赢的“价值网络(value network)”两个神经网络。而更为强大的阿尔法元只使用了一个神经网络,也就是两个网络的整合版本。 这个意义上而言,“AlphaGo Zero”译成“阿尔法元”,而不是字面上的“阿尔法零”,“内涵更加丰富,代表了人类认知的起点——神经元。”李昕教授说。 上述研究更新了人们对于机器学习的认知。“人们一般认为,机器学习就是关于大数据和海量计算,但是通过阿尔法元,我们发现,其实算法比所谓计算或数据可用性更重要。”DavidSilver博士说。 李昕教授长期专注于制造业大数据研究,他认为,这个研究最有意义的一点在于,证明了人工智能在某些领域,也许可以摆脱对人类经验和辅助的依赖。“人工智能的一大难点就是,需要大量人力对数据样本进行标注,而阿尔法元则证明,人工智能可以通过‘无监督数据(unsupervised data)’,也就是人类未标注的数据,来解决问题。” 有人畅想,类似的深度强化学习算法,或许能更容易地被广泛应用到其他人类缺乏了解或是缺乏大量标注数据的领域。 不过,究竟有多大实际意义,能应用到哪些现实领域,李昕教授表示“还前途未卜”,“下围棋本身是一个比较局限的应用,人类觉得下围棋很复杂,但是对于机器来说并不难。而且,下围棋只是一种娱乐方式,不算作人们在生活中遇到的实际问题。” 那么,谷歌的AI为什么会选择围棋? 据《第一财经》报道,历史上,电脑最早掌握的第一款经典游戏是井字游戏,这是1952年一位博士在读生的研究项目;随后是1994年电脑程序Chinook成功挑战西洋跳棋游戏;3年后,IBM深蓝超级计算机在国际象棋比赛中战胜世界冠军加里•卡斯帕罗夫。 除了棋盘游戏外,IBM的Watson系统在2011年成功挑战老牌智力竞赛节目Jeopardy游戏一战成名;2014年,Google自己编写的算法,学会了仅需输入初始像素信息就能玩几十种Atari游戏。 但有一项游戏仍然是人类代表着顶尖水平,那就是围棋。 谷歌DeepMind创始人兼CEO Demis Hassabis博士曾在2016年AlphaGo对阵李世石时就做过说明,有着3000多年历史的围棋是人类有史以来发明出来的最复杂的游戏,对于人工智能来说,这是一次最尖端的大挑战,需要直觉和计算,要想熟练玩围棋需要将模式识别和运筹帷幄结合。 “围棋的搜索空间是漫无边际的——比围棋棋盘要大1个古戈尔(数量级单位,10的100次方,甚至比宇宙中的原子数量还要多)。”因此,传统的人工智能方法也就是“为所有可能的步数建立搜索树”,在围棋游戏中几乎无法实现。 而打败了人类的AlphaGo系统的关键则是,将围棋巨大无比的搜索空间压缩到可控的范围之内。David Silver博士此前曾介绍,策略网络的作用是预测下一步,并用来将搜索范围缩小至最有可能的那些步骤。另一个神经网络“价值网络(valuenetwork)”则是用来减少搜索树的深度,每走一步估算一次游戏的赢家,而不是搜索所有结束棋局的途径。 李昕教授对阿尔法元带来的突破表示欣喜,但同时他也提到,“阿尔法元证明的只是在下围棋这个游戏中,无监督学习(unsupervised learning)比有监督学习(supervised learning)‘更优’,但并未证明这就是‘最优’方法,也许两者结合的semi-supervised learning,也就是在不同时间和阶段,结合有监督或无监督学习各自的优点,可以得到更优的结果。” 李昕教授说,人工智能的技术还远没有达到人们所想象的程度,“比如,互联网登录时用的reCAPTCHA验证码(图像或者文字),就无法通过机器学习算法自动识别”,他说,在某些方面,机器人确实比人做得更好,但目前并不能完全替换人。“只有当科研证明,一项人工智能技术能够解决一些实际问题和人工痛点时,才真正算作是一个重大突破。” 昆山杜克大学常务副校长、中美科技政策和关系专家丹尼斯·西蒙(Denis Simon)博士在接受澎湃新闻采访时表示,阿尔法元在围棋领域的成功说明它确实有极大的潜力。阿尔法元通过与自身对弈实现了自身能力的提升,每一次它都变得更聪明,每一次棋局也更有挑战性。这种重复性的、充分参与的学习增强了阿尔法元处理更高层次的、战略复杂问题的能力。但缺点是这是一个封闭的系统。“阿尔法元如何能够超过自身的局限获得进一步的成长?换句话说,它能跳出框框思考吗?”[详情]
选自Reddit机器之心编译昨日,DeepMind在《自然》杂志上发表了一篇论文,正式推出人工智能围棋程序AlphaGo的最新版本AlphaGoZero。同时,[详情]
机器之心转载自知乎作者:田渊栋昨日,DeepMind在《自然》杂志上发表了一篇论文,正式推出人工智能围棋程序AlphaGoZero。这篇论文的发布引起了业内极大[详情]
安妮李林发自凹非寺量子位出品|公众号QbitAI昨天AlphaGo再次震惊所有人。刚刚,这个史上最强围棋AI的两位主要开发者,DavidSilver和Julia[详情]
本文来源:知乎 作者:不会功夫的潘达 在2017年10月19日DeepMind发布了其最新成果AlphaGo zero, 该算法不再需要学习人类棋手的下法,而直接采用自对弈进行训练。AlphaGo zero在训练效率与最终表现上相比之前都有了非常大的进步…… 我读着新论文,对比前一个版本的论文(即AlphaGo Fan版本)。直观感受如下: 旧版AlphaGo: AlphaGo Zero: 如果我对围棋一无所知,读初代AlphaGo的论文,可能会有以下疑问: 策略网络和价值网络,结构和功能很接近啊,为什么不合并成一个呢? 为什么要用专家的棋谱作为初始训练样本?从一张白纸开始训练岂不是更具有普遍性? 快速走子是什么鬼?只用价值网络评估不是更有效率吗? 为什么要输入围棋知识?AlphaGo的强化学习过程难道学不到这些知识吗? 旧版的AlphaGo,虽然神功小成,但斧凿痕迹显著。好似一只机器人女友,虽有绝色容颜,却长着机械手、声音冷如谷歌娘(误)。理想的围棋人工智能,应该是简洁、优雅、浑然天成,就像死宅们的老婆新垣结衣一样(大雾)。 而新版的AlphaGo,真的造出了栩栩如生的Gakki(误)。 具体地说,AlphaGo Zero相比于初代AlphaGo,有以下几点改进: 1、将策略网络和价值网络合并,组成一个可以同时输出策略p和价值v的新网络。 1.1、简化了新网络的结构。新策略·价值网络的输入特征平面由48个减少到了17个。其中,涉及围棋知识的输入特征(气(liberty)、征子(ladder))被删去。 2、新策略·价值网络只需通过强化学习来训练,无需监督学习。即无需输入人类高手棋谱作为初始训练样本,只需用随机落子作为初始训练样本。 3、优化了蒙特卡洛搜索树,主要是省去了快速走子(rollout policy),节约大量实战计算成本。 3.1、 快速走子策略也需要输入大量人类已知的围棋知识,比如如何点死大眼(Nakade, 如点死直三、丁四、刀把五等棋型的唯一招法)。省去快速走子,也就省去了输入这些知识的麻烦。 4、改卷积网络为残差网络,提高训练效率。 留下的,是一个从零开始训练的神经网络,以及用简单到不能再简单的MCTS算法行棋的AlphaGo Zero。 知易行难。这些改进貌似不难想到,是因为AlphaGo Zero本来就是研究者理想中的女神。而初版AlphaGo不够女神,不是因为研究者不想,而是暂时做不到。举个例子,AlphaGo Fan版本中,神经网络的输入由48个特征平面构成。其中两个平面分别表示,某一步棋是否是成功的征子,和某一步棋是否是成功的逃征子。 这是征子的基本图。白1逃跑,黑2、4以下分别从两侧叫吃白棋,使白方始终只有一口气。一直追到棋盘尽头,白方最终无路可逃。黑棋大获全胜。 而如果征子路上有对方的小伙伴接应,比如上图右上角的黑棋。那么征子就会失败,并且白棋满盘皆输。 征子是围棋的基本知识,初学者在前两三节课就会学到。但实战的征子可以非常复杂,甚至搞晕职业棋手。 这张图来自职业棋谱,赵善津胜王铭琬。注意,白棋中央一大坨已经被征死了。白方看错了引征,招致全盘皆输。 白棋硬跑的后果如图。。全军覆没 征子也能搞晕神经网络。我刚才在某计算机围棋的讨论区看到Joona Kiiski网友的观点,和大家分享一下: - The learning was based on self-play。 Understanding ladders is perhaps not so important if your opponent doesn‘t understand them either。。。 Every time a decisive ladder appears on the board, the result is practically a coin toss。- And as others have pointed out, unlike almost all other go features, ladders are not at all a local feature。 The features need to build up through a huge number of convolution layers, before it works。 And it’s difficult to build this understanding incrementally (unlike e.g。 life & death where you can start with simple cases and then move to more difficult cases), so we lack bias to direct the learning to the right direction。 大意如下: 和绝大部分围棋的特征(比如死活、官子、定式等)不同,征子完全不是局部特征,而是全局特征。这就意味着,在神经网络能正确处理征子之前,征子的特征需要通过大量卷积层来慢慢建立。这会给神经网络的训练带来潜在的麻烦。 更要命的是,在征子上一旦出现失误,大胜的棋局会直接变成大败。 据此可以推测,征子的这些麻烦特性,使得初代AlphaGo不得不把征子作为输入神经网络的特征之一。(另一个软件Zen,即使和初代AlphaGo做了类似的处理,实战的征子依然会偶尔出错,被人类棋手逆袭了好多盘。) AlphaGo Zero的神经网络,大胆省去了征子特征的输入。细细品味训练过程,略微吃惊:神经网络直到训练的(相对)后期才学会征子。 如果对局双方(黑AlphaGo-白AlphaGo)都不懂征子,那么总体结果也不会差太多吧。每个征子的结果就好像投硬币一样随机,总的胜负加起来差不多是零(大误)。 或许是开发团队好运,更有可能是反复尝试以后才成功。总之,在征子上,AlphaGo Zero涉险过关。 同理,分拆策略、价值网络,以及采用快速走子,是旧版AlphaGo的暂时妥协,而在新版终于得以解决。 DeepMind,及其母公司谷歌的终极目标不是破解围棋,而是造出通用人工智能。通用智能不需要额外专业知识。AlphaGo Zero在无围棋知识输入的前提下达到如此高度,可以说离通用智能又近了一步。 大道至简。对于AlphaGo,最简洁的,就是最美的。 说棋。 摒弃人类棋谱输入,从零(Zero因此得名)开始训练阿尔法狗。去年谷李大战以来,棋迷翘首以盼的“纯净版”阿尔法狗终于问世。 更恐怖的是,Zero经过三天训练就达到AlphaGo Lee的水平 (即去年战胜李世乭的版本,ELO ~3750。对比今日柯洁ELO ~3660。),节约了90%+的时间。见下图。 四十天之后,Zero甚至超越了姐妹版本Master,对Master实现90%胜率。Master和Zero的主要区别是,Master有人类棋谱输入,经历监督学习(SL)而非强化学习(RL)。 我在论文中学到了一句拉丁语,starting tabula rasa, 从一张白纸开始。看Zero的训练过程,就像看一个婴儿成长,妙趣横生。 第三个小时,如同幼儿堆石子。第二十小时,有板有眼。第70小时,复杂局面处理自如,已是顶尖高手。 看AlphaGo学会的定式,更是有趣。A行是AlphaGo在训练过程中学会的人类定式。B行则是在训练的不同阶段,AlphaGo最喜欢的定式。 B行第一个,黑棋下在1,1,显然是卖萌,此时大概是第10个小时。B行第二个,黑星位,白棋外靠(!),黑退,白扳粘的变化。此变化不在人类课本当中,白2略惊悚,直观看也是白棋稍亏。果然,在40小时以后,本定式被无情淘汰(见下图)。 第三变,点三三!千呼万唤始出来。 20小时以后此变化出现频率猛增,并一度达到3%,此后缓慢回落,最终稳定在0.5%。这是我曾经最喜欢的定式之一,也是定式书上必介绍的一个基本型。黑地白势,各得其所。 作为对比,点三三的另一变如下: 在五十小时后,黑5飞的频率大增。至70小时,此变频率达0.2%。从最终的自战对弈来看,此变的频率似乎超过了黑5扳(有待查证)。很有意思,AlphaGo对此定式的认识过程和人类有些相似。长久以来,黑5扳都是点三三的标准变化。直到最近十年左右,黑5飞才开始变得频繁起来。由于Master的影响,人类棋手开始频繁点三三,并且把黑5飞作为标准变化。上图的后续只是此定式的一变,在Zero自战谱中还看到了一些微小的改动。 下一个“定式”最有意思。 1-5正常。白6奇思妙想!人类绝少在开局阶段往二路下。白10贴以后,黑棋需要补断,白棋活角。局部尚未定型,得失不明。可惜此变昙花一现,不知AlphaGo是否发现了局部更好的手段。 欣赏一局完全体Zero的棋谱 37-41,潇洒、放肆、不拘一格。状态爆表的一流棋手偶尔也有如此表演,而这对于AlphaGo只是正常操作。 白130。 官子同样滴水不漏。(黑只能在A位接。若在B位吃,白O17即可出棋。白棋点完以后,T17有先手味道。) Zero的Elo等级分是5000分,人间已无敌手。但其左右互搏仍互有胜负,可见离围棋上帝尚有距离。Zero当为近阶段围棋人工智能的高峰,但尚不是围棋的终点。 于我,AlphaGo Zero还有以下几个悬念: 1、Zero的策略·价值网络是否对所有贴目值都生效,还是只针对7.5目。(论文中未指明)再进一步,AlphaGo Zero心目中的最佳贴目是多少。 2、Zero的官子,特别是小官子阶段,是否会犯错。重点是,有无因为官子失误而被翻盘的棋局。 3、以大贴目为前提,Zero会如何应对白方的模仿棋。 希望明天能在Reddit上得到解答。 三千年的围棋,AlphaGo只用三天走过。谨以《贺新郎·读史》结束本文: 人猿相揖别。只几个石头磨过,小儿时节。铜铁炉中翻火焰,为问何时猜得?不过几千寒热。人世难逢开口笑,上疆场彼此弯弓月。流遍了,郊原血。 一篇读罢头飞雪,但记得斑斑点点,几行陈迹。五帝三皇神圣事,骗了无涯过客。有多少风流人物?盗跖庄屩流誉后,更陈王奋起挥黄钺。歌未竟,东方白。[详情]
10月19日凌晨,谷歌旗下的人工智能“阿尔法围棋”在几次世界瞩目的人机大战后站在了围棋之巅,现在它又以一种新的方式超越了自己:新版本“从零开始”学习围棋,仅用3天就击败其前辈版本,成为新的王者。研究人员认为,这一进步标志着人工智能的巨大突破,意味着人工智能可以更好地进入对它来说本是一片空白的领域。 [详情]
10月19日凌晨,DeepMind团队公布了他们最新版AlphaGo论文,文中透露最新版本的AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个神经网络,该版本也是AlphaGo最强版本,已经远远超过李世石版本及Master的水准。消息一出就占据了微博热搜榜榜首,更是引发了网友的趣评。 以下为网友评论: 网友评论部分截图 飞羽临渊:数学是上帝书写宇宙的文字,任何棋类都是一个有趣的数学游戏,用数学的算法解决人类的难题就是人类在掌握上帝的文字[加油] 吹泡泡地小笼包:说明现在的人类棋手离着围棋上帝的距离还是相当远,新版alphago基本已经可以让人类棋手两子了,zero恐怕要让人类三子,然而zero还不是围棋上帝。 闲置围棋:为什么要拿人类跟机器比?人类的双手再努力。也不会有挖沟机一样的能力。 可乐爱多_:佐为已经晕倒在厕所。。。。 山水客--青岛:真正的自学成才 aaappp65:人类可以创造上帝 弈_靈:真是天上一日地上千年啊……千年时光也未必及得上AI的一日之功啊 山水客--青岛:Zero随着程序训练的进行,它独立发现了人类用几千年才总结出来的围棋规则,还建立了新的战略,为这个古老的游戏带来新见解。 斯文在兹_J:要好好休息呀,科技进步源于人类进步,可以相辅相成啊 朱彥碩:學不來。。。。。我的智商學不來。。。。。。。。。。。 肌肉阳刚:ZERO吊打MASTER[嘻嘻] pighead1314:哈哈哈master你也有今天 今夜踏月而来:没意外的话,最新版的AlphaGo Zero应该可以让柯洁5子。。。。 愤怒的金刚鹦鹉:10后出生的孩子也怪可怜的,长大后不仅要面临着来自人类的竞争,还要跟AI抢饭碗,这点基本上已经无法否认了。我想未来对人才的定义必然有着比今天更高的标准,这么看起来,有远见的父母不仅得加大对孩子的砸钱力度,还要把孩子往AI触角暂时无法企及的领域去培养才行了[思考] Lu蔚cky:以后计算性的程序化的工作都要被人工智能取代了,好在情绪化感性的工作不会被人工智能取代。。。。不过也正常,就好比有了计算机后,用算盘越来越少了,一个道理。运算在厉害,始终是人类工作的辅助工具,不可能取代人类情感。 (梓沫)[详情]
中新网10月19日电 据《日本经济新闻》报道,美国谷歌旗下的英国子公司沉思科技(DeepMind Technologies)日前开发出了新版本围棋用人工智能(AI)“AlphaGo Zero”。 此前的AlphaGo在击败全球顶级棋手时通过学习约3千万专业棋手的对弈数据使自身变得强大。但AlphaGo Zero无需人类作出示范,也能反复与自己对弈,借助自学创造出胜率最高的下法。 据报道,以前的AlphaGo对人类就已经具有压倒性优势,棋力达到史上最强。这种实力有助于将来在产业方面得到应用,例如通过大量数据自动找到调整电力供需的时机等。 英国科学杂志《自然》杂志10月19日发表了相关文章。谷歌仅向AlphaGo Zero教授了围棋规则。AlphaGo Zero 将现有的2种学习方法结合起来,分别通过2种方法思考下一手,还能对彼此思考出的结果进行参照。 据悉,AlphaGo Zero最初是随机落子,但通过反复与自己对弈,迅速提高水平。在进行实验3天后,面对2016年3月击败顶级棋手李世石时的旧版AlphaGo取得了100战全胜。 据了解,人类在多年的围棋历史中不断自主完善了被称为“定式”的惯用下法。在试验40天后,AlphaGo Zero已经与自己对弈 2900万局,强大程度超过2016年5月时面对全球最强棋手柯洁九段取得3连胜的AlphaGo版本。据称,AlphaGo Zero还开始掌握人类未知的下法。 美国围棋协会主席安迪·奥肯等在发给《自然》杂志的稿件中指出,“AlphaGo Zero在中盘阶段的若干判断简直就像迷一样”。另一方面,随着人工智能和人类在下棋时总结出了相同的定式,证明“人类长达数个世纪的围棋活动取得的成果并非全部错误”。 沉思科技的首席执行官杰米斯·哈萨比斯在AlphaGo击败最强人类棋手时表示,“这是最后一次和人类对弈”。为达成“完全不依赖人类的人工智能”这个目标,哈萨比斯在此后继续对AlphaGo进行了改进。 此前,人工智能曾将人类的对弈数据作为“教师”加以学习。因此有观点指出,人工智能虽然强大,但仅仅处于人类知识的延长线上。沉思科技通过让人工智能从零开始自学,采用被称为“没有教师的学习”方式,创造出了不受人类思维束缚的革新性人工智能。 哈萨比斯表示,“人工智能有可能推动人类的智力向前发展,给全人类带来积极影响”。 报道指出,沉思科技与英国国家医疗服务体系(NHS)展开合作,除了将人工智能用于早期发现疑难杂症外,还将用于调整电力供需等方面。将来,还期待人工智能在依靠人类力量难以解决的新材料开发、探究蛋白质生成机制等方面做出贡献。 报道还称,新技术将来还可能在产业方面做出贡献。例如,从大量数据中发现人类难以意识到的提升效率的方式等。 据悉,以各种用电数据为基础,人工智能将有助于节省电力。由于像AlphaGo Zero一样的人工智能可以“无师自通”,在宇宙和海洋等观测数据不足的领域也有可能做出贡献。[详情]
文章来源:PingWest中文网 5月27日,端午节假期的前一天,少年棋手柯洁和AlphaGo的故事在乌镇结束了。 在过去的几天里,AlphaGo战胜了当时这颗星球上最强的人类棋手。柯洁说:要专注于和人类下棋,不再和机器下棋了。 AlphaGo的开发团队说:我们要专注于将AlphaGo的技术应用到其它领域,AlphaGo也不会再和人类下棋了。 虽然更多的是唏嘘,但人类围棋界还是放下了心来。终于不用再和这个疯狂而变态的选手较劲了。 然而,5个月后,AlphaGo又有了新成果,这一次还是和围棋有关。如果说AlphaGo战胜柯洁是机器与人类的战争,那么这一次AlphaGo Zero的突破更像是某种客观规律的战争。 AlphaGo似乎触摸到了围棋这一游戏的尽头。 自学成才的AlphaGo Zero AlphaGo不是早就战胜人类了么?DeepMind不是说不再让AlphaGo和人类下棋了吗? 没错,这一次AlphaGo的大新闻,确实和人类“没什么关系”。 DeepMind中AlphaGo项目组的主要负责人David Silver介绍,AlpheGo Zero目前已经是这个世界上最聪明的计算机棋手,它连续击败了此前战胜围棋世界冠军李世乭的AlphaGo Lee版本100次。 之所以以李世乭的版本作为对比而没有使用与柯洁对战的版本进行对比,是因为受到环境所限今年5月在乌镇与柯洁对战的AlphaGo其实是一个特殊的离线Alpha Master版本,仅由一个TPU在不连接网络的情况下完成对战。 无论是击败李世乭的版本还是击败柯洁的版本,过去的AlphaGo在“学习如何下棋”这个阶段,使用的都是大量的人类经典棋谱。它们被告知人类的高手在不同的情况下应该如何应对。而这一次的AlphaGo Zero在学习过程中完全没有使用任何人类的棋谱,它对玩法的探索完全是从自我对弈中学习的。 开始AlphaGo Zero会从非常随机且无厘头的下法开始进化,而它的陪练(另一个AlphaGo Zero)的水平也很低。然后AlphaGo Zero会从每一场胜负中,取得经验,使得自己的奇艺水平不断提高。 David Silver说,很多人相信在人工智能的应用中算力和数据是更重要的,但在AlphaGo Zero中他们认识到了算法的重要性远高于算力和数据——在AlphaGo Zero中,团队投入的算力比打造上一个版本的AlphaGo少使用了一个数量级的算力。 使用了更先进的算法和原理,让AlphaGo Zero的程序性能本身更加优秀,而不是等待硬件算力技术的提升。 AlphaGo Zero从零开始摸清围棋规则,就像是一个完全不会下棋的孩子。自我学习3天后,超过AlphaGo Lee(战胜李世乭版本);21天后,超过AlphaGo Master(网络对战60:0版本);在训练40天后,对弈双方相互交替持黑白棋的情况下,Zero对Master胜率超过90%。 在训练完成的AlphaGo Zero只能给,人们发现它自学成才的许多围棋打法与人类上千年来总结的知识是不谋而合的,比如打劫、征子、棋形、布局在对角等,都有人类围棋的影子。 所以人类棋手也不用伤心,这恰恰证明人类在过去的几千年里摸索出了围棋这一游戏的“自然规律”。而人工智能与人类棋手的对比就像是汽车和跑步。 每下一步仅需要思考是0.4秒的AlphaGo Zero所产生的美感与人类在紧张对弈时的美感是完全不同的,就像没有人会把F1方程式当赛跑比赛看一样。 那么,如何做到的? 祭出老图,我们先复习一下以前的AlphaGo是怎么工作的: 过去的AlphaGo每一棋的思考,分为两个界限清晰的步骤是: 1。获取棋局信息后,AlphaGo会根据策略网络(policy network)探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。这个过程得出的结果是概率分布,既棋盘上每个位置都有机会被选中,但客观情况下会有一个特定的区域拥有更高的概率。 2。根据上一步得出的概率分布,价值网络(valuenetwork)会对概率高的地区再进一步的判断,得出一个只有两个值的结果,每个落子位置要么被判定为会让自己赢,要么被判定为让对手赢。 在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。 而新的AlphaGo在下棋时中并没有明显的策略网络与价值网络的分界,它将策略网络和价值网络设定为一个新的深层神经网络fθ(s)= (p, v) 。其中s为棋盘位置,p参数代表原本策略网络中代表落子概率,v参数代表落子后的胜率。 fθ(s)同时对自己和对手的胜率进行预测,在每个位置s,神经网络fθ都会进行一次计算。在其中一次对战获胜后,赢的一方所使用的p和v值将被作为参数调整进fθ。使得每一次对战后的AlphaGo Zero算法都在朝着可能存在的不败公式fθ(s)=(π, z)进发。 所以,有什么用? “计算机下棋再强,有什么用?” 马云在今年曾经对AlphaGo提出过质疑,这确实也是许多普通吃瓜群众的质疑。计算机下棋,除了欺负柯洁弟弟之外确实没有什么用。但是,重要的是,在研究计算机解决围棋这一课题的过程中,DeepMind的工程师在人工智能上产生了重要的突破。 这些突破可以广泛的应用到其它实际生产的领域,比如在去年7月份,DeepMind就表示:如果全面推动 AI 实装到数据中心的话,最高可以达到 15%的用电削减。 Deepmind认为,这一次AlphaGo Zero上的突破能够让人工智能在一些缺少数据或数据异常昂贵的领域更好的发展,比如模拟蛋白质折叠研发新药、寻找新的化合材料等。 最重要的是,通过算法提升人工智能的效率,能够大幅减少对硬件“堆料”的依赖。如果你还不能理解人工智能如何减少数据中心电量的话,可以看一下这幅直观的对比图: 这是 AlphaGo 诞生以来四个版本的能耗对比,用一个与生活更息息相关的数字大概能让你理解这背后的价值。 2017年,Google公布了其在2015年全年的数据中心耗电情况,当时Google一年的用电量为57亿千瓦时,如果以北京这种高人均用电的大城市做对比,这相当于北京712万人的用电量。 在这样的数字上,仅仅是节省10%,也能够对成本和环境造成巨大影响。 还有另一个对比可能让你理解人工智能对我们生活的改变。如果你是90年代生人,应该还记得在生物书上看到过那个“人类基因组计划”——对一个人的23对染色体进行全量测序。 这个耗时13年,耗资超过10亿美元,美国,中国,英国,日本,法国和德国6个国家20多所大学和研究机构完成的“世纪工程”。如今如果利用机器学习“再做一次”的周期大约为两周,成本大约为2万美金。而包括Intel、华大基因、IBM和Google等在内的新科技公司,正在力图在2020年把这个数字降到24小时,1000美元。 而全量基因测序可以被认为是人类“攻克癌症”的重要一步,无论是在癌症的预防、筛查、优生还是对癌症药物的研究和治疗上,都会彻底改变现有癌症的现有诊疗方式。 这可能就是一群硅谷的高材生要做出一条狗和围棋这个人类玩了上千年的桌面游戏较劲的原因吧。[详情]
10月19日凌晨,DeepMind公布了他们最新版AlphaGo论文,文中透露最新版本的AlphaGo Zero的算法架构。论文发出的消息迅速点燃了围棋界,和AlphaGo交手的中国棋手柯洁在微博感叹:“对于alphago的自我进步来讲。。。人类太多余了”。 在5月份的乌镇围棋峰会期间,DeepMind方面对当时所使用的AlphaGo版本未做过多介绍。只是透露,这版的AlphaGo已经可以让第一次人机大战时对阵李世石版本的AlphaGo3子。尽管人们逐渐了解到,这3子的差距更多的是由算法所致,但还是足够令人震撼。 乌镇柯洁对决AlphaGo 乌镇人机对决中,柯洁拼劲全力但最终仍以0-3负于AlphaGo,在第三局中,柯洁面对无懈可击的AlphaGo不禁落泪,赛后他感叹:“AlphaGo实在太完美了”! 今天,DeepMind公布了最新版AlphaGo的神秘面纱,它被称作AlphaGo Zero,只是确定了围棋规则,并无任何人类干预。这一款AlphaGo完全通过自我博弈成长,训练仅3天便100-0击败那个4-1赢李世石的版本,21天达到Master的水准。而在乌镇击败柯洁的版本为Master的优化版。 柯洁在微博中不禁再次感慨:一个纯净、纯粹自我学习的alphago是最强的。。。对于alphago的自我进步来讲。。。人类太多余了 被AlphaGo Zero的消息所震撼的远不止柯洁一个人,古力在微博中说道:20年不抵3天啊!我们的伤感,人类的进步! 唐韦星发微博表示:看了之后不知道说什么了,它确实不需要我们的知识,之前版本用了好几年被这个40天的打败似乎就是我们拖后腿了,ps我现在突然想到未来简史说的人类的分层,小部分成为神,大部分是废物 古力随后在唐韦星的微博下评论:我们都是拖后腿的[笑] (文玄)[详情]
伦敦当地时间10月18日18:00(北京时间19日01:00),AlphaGo再次登上世界顶级科学杂志——《自然》。 一年多前,AlphaGo便是2016年1月28日当期的封面文章,Deepmind公司发表重磅论文,介绍了这个击败欧洲围棋冠军樊麾的人工智能程序。 今年5月,以3:0的比分赢下中国棋手柯洁后,AlphaGo宣布退役,但DeepMind公司并没有停下研究的脚步。伦敦当地时间10月18日,DeepMind团队公布了最强版AlphaGo ,代号AlphaGo Zero。它的独门秘籍,是“自学成才”。而且,是从一张白纸开始,零基础学习,在短短3天内,成为顶级高手。 团队称,AlphaGo Zero的水平已经超过之前所有版本的AlphaGo。在对阵曾赢下韩国棋手李世石那版AlphaGo时,AlphaGo Zero取得了100:0的压倒性战绩。DeepMind团队将关于AlphaGo Zero的相关研究以论文的形式,刊发在了10月18日的《自然》杂志上。 “AlphaGo在两年内达到的成绩令人震惊。现在,AlphaGo Zero是我们最强版本,它提升了很多。Zero提高了计算效率,并且没有使用到任何人类围棋数据,”AlphaGo之父、DeepMind联合创始人兼CEO 戴密斯·哈萨比斯(Demis Hassabis)说,“最终,我们想要利用它的算法突破,去帮助解决各种紧迫的现实世界问题,如蛋白质折叠或设计新材料。如果我们通过AlphaGo,可以在这些问题上取得进展,那么它就有潜力推动人们理解生命,并以积极的方式影响我们的生活。” 不再受人类知识限制,只用4个TPU AlphaGo此前的版本,结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练。 在战胜人类围棋职业高手之前,它经过了好几个月的训练,依靠的是多台机器和48个TPU(谷歌专为加速深层神经网络运算能力而研发的芯片)。 AlphaGo Zero的能力则在这个基础上有了质的提升。最大的区别是,它不再需要人类数据。也就是说,它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。值得一提的是,AlphaGo Zero还非常“低碳”,只用到了一台机器和4个TPU,极大地节省了资源。 AlphaGo Zero强化学习下的自我对弈。 经过几天的训练,AlphaGo Zero完成了近5百万盘的自我博弈后,已经可以超越人类,并击败了此前所有版本的AlphaGo。DeepMind团队在官方博客上称,Zero用更新后的神经网络和搜索算法重组,随着训练地加深,系统的表现一点一点地在进步。自我博弈的成绩也越来越好,同时,神经网络也变得更准确。 AlphaGo Zero习得知识的过程 “这些技术细节强于此前版本的原因是,我们不再受到人类知识的限制,它可以向围棋领域里最高的选手——AlphaGo自身学习。” AlphaGo团队负责人大卫·席尔瓦(Dave Sliver)说。 据大卫·席尔瓦介绍,AlphaGo Zero使用新的强化学习方法,让自己变成了老师。系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,通过神经网络强大的搜索算法,进行了自我对弈。 随着自我博弈的增加,神经网络逐渐调整,提升预测下一步的能力,最终赢得比赛。更为厉害的是,随着训练的深入,DeepMind团队发现,AlphaGo Zero还独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。 自学3天,就打败了旧版AlphaGo 除了上述的区别之外,AlphaGo Zero还在3个方面与此前版本有明显差别。 AlphaGo-Zero的训练时间轴 首先,AlphaGo Zero仅用棋盘上的黑白子作为输入,而前代则包括了小部分人工设计的特征输入。 其次,AlphaGo Zero仅用了单一的神经网络。在此前的版本中,AlphaGo用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。 第三,AlphaGo Zero并不使用快速、随机的走子方法。在此前的版本中,AlphaGo用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。相反,新版本依靠地是其高质量的神经网络来评估下棋的局势。 AlphaGo几个版本的排名情况。 据哈萨比斯和席尔瓦介绍,以上这些不同帮助新版AlphaGo在系统上有了提升,而算法的改变让系统变得更强更有效。 经过短短3天的自我训练,AlphaGo Zero就强势打败了此前战胜李世石的旧版AlphaGo,战绩是100:0的。经过40天的自我训练,AlphaGo Zero又打败了AlphaGo Master版本。“Master”曾击败过世界顶尖的围棋选手,甚至包括世界排名第一的柯洁。 对于希望利用人工智能推动人类社会进步为使命的DeepMind来说,围棋并不是AlphaGo的终极奥义,他们的目标始终是要利用AlphaGo打造通用的、探索宇宙的终极工具。AlphaGo Zero的提升,让DeepMind看到了利用人工智能技术改变人类命运的突破。他们目前正积极与英国医疗机构和电力能源部门合作,提高看病效率和能源效率。 澎湃新闻记者 王心馨 虞涵棋[详情]
在围棋比赛上,人工智能程序AlphaGo横扫世界顶尖棋手的事情,早已不是新闻。但人们聊以慰藉的是,AlphaGo是在大量学习了人类棋谱后,才慢慢“封神”。 这一认知现在也被改写。 10月19日凌晨,在国际学术期刊《自然》(Nature)上发表的一篇研究论文中,谷歌下属公司Deepmind报告新版程序AlphaGo Zero:从空白状态学起,在无任何人类输入的条件下,它能够迅速自学围棋,并以100:0的战绩击败“前辈”。 有专家告诉澎湃新闻(www.thepaper.cn),“抛弃人类经验”和“自我训练”并非AlphaGo Zero最大的亮点,其关键在于采用了新的reinforcement learning(强化学习的算法),并给该算法带了新的发展。 此外,有专家表示,应理性看待AlphaGo Zero。Deepmind的论文一发表,TPU的销量就可能要大增了。其100:0战绩有“造”真嫌疑。 该论文称,在数百万局自我对弈后,随着程序训练的进行,AlphaGo Zero独立发现了人类用几千年才总结出来的围棋规则,还建立了新的战略,为这个古老的游戏带来新见解。 《自然》为该论文配发两篇评论文章,一篇来自计算机科学家,一篇来自围棋选手。 世界顶尖棋手的养成,动辄需要数十年的训练、磨砺。但AlphaGo Zero创造了一个纪录:3天。 AlphaGo Lee是AlphaGo Zero的“前辈”。它拥有48个TPU(神经网络训练专用芯片),在参考大量人类棋谱,并自我对弈约3000万盘、训练数月后,2016年3年月,AlphaGo Lee以4:1的击败韩国九段棋手李世石,引发人们关注。 AlphaGo Zero仅拥有4个TPU,零人类经验,其自我训练的时间仅为3天,自我对弈的棋局数量为490万盘。但它以100:0的战绩击败前辈。 Deepmind公司详解了AlphaGo Zero的更多不同之处,在识别棋盘盘面时,它直接识别黑白棋子,而非要将图像分类;它仅使用一张人工神经网络,此前的两张被合二为一。 但更大的革新之处在于,AlphaGo Zero采用了新的算法——强化学习算法。在每一次训练后,AlphaGo Zero都能根据训练结果,进一步优化其算法。 上海交通大学计算机科学领域的一位教授告诉澎湃新闻,他认为,AlphaGo Zero发展了强化学习(Reinforcement Learning)算法。受到AlphaGo Zero的启发,该算法可能应用在更多的“求解”类问题上。 他将强化学习的算法比作“摸着石头过河”。他描述了“求解”类问题的共同特征:这些问题的求解,都要分很多步骤才能完成,整个过程相对漫长,但在结束后,可以根据结束时的状态,来评判此前每一步决策的质量。像蛋白质折叠的预测,新材料的设计等,都属于此类问题。 他表示,“求解”类问题相对简单,它们不同于我们人生中的选择,人生中的每个决定不太容易评价其决策质量。 上海纽约大学计算机科学教授张峥表示,从算法上来说,AlphaGo Zero比其“前辈”更简洁、漂亮。这一次,AlphaGo Zero摆脱了人为的大数据,在人类给定的一个规则下,自主发现新知识,并且纠正人类的错误知识,而且是以惊人的速度达到这一点。有趣的是,AlphaGo Zero却无法解释(它是如何完成这一切的),只能demo(样本)给人类。 复旦大学计算机科学技术学院教授危辉告诉澎湃新闻,AlphaGo Zero的算法、程序,如同一个黑箱,在一次又一次的自我训练后,有了很多优化。拷贝那一行行代码,就可以“继承”这个被优化过的算法。但算法中的详情,人们并不知晓。 危辉将围棋盘面上各种变化比作宇宙中的星辰,通过人类智力、直觉,人们可能已经触及了其中百万分之一的情形,AlphaGo Zero可能触及了其中其中百万分之五的情形,“比人类多,但肯定没有穷尽。” 张峥表示,AlphaGo Zero等人工智能及地球上的计算能力是否穷尽搜索了围棋盘面的各种可能,他不清楚,但AlphaGo Zero等人工智能一定比人更快,而且有新的发现。换句话说,会产生新的棋谱。 上海交通大学软件学院教授陈海波认为,从理论上说,强化学习的算法本来就可以实现自我训练,AlphaGo Zero提供了一个非常好的范例。人工智能的发展依赖三个要素:算法、平台和数据。像AlphaGo Zero一样,人工智能如果使用合适的算法,并改进算法,降低其对数据与平台计算能力的依赖,有助于其推广和应用。 中国科学院自动化研究所复杂系统管理与控制国家重点实验室任主任王飞跃表示,大家应该理性看待AlphaGo Zero的研究成果。Deepmind公司的这一论文一发表,TPU的销量可能就要大增了。他说,AlphaGo的程序的确越来越简洁、有效。但那种“看了AlphaGo Zero,就认为人类经验没用了,人工智能已经超过人类智力”的观点不正确。 他认为,在所有“规则界定得非常清楚,而且规则中包含了所有信息”的任务中,机器或程序都应超过人类。正如汽车会跑得比人快,飞机会飞得比人高。而人工智能在应用中面临更多挑战的是那些规则不清,或者规则清楚但不包含所有信息的事情。在军事国防,社会经济,特别是日常生活的很多应用场景都是这样,人为界定出来的规则可以非常简化,但无法确定所有信息,比如交通规则。这时候,人工智能会做一个好的安全且有效决策吗? 王飞跃表示,真正智能的是AlphaGo Nothing,即人类,为定规则而生。而机器是为执行而造的。 此外,他认为,AlphaGo Zero 以100:0的成绩,战胜AlphaGo Master,其结果十分令人鼓舞,但有误导,且有“造”真的嫌疑。“这让我想起成语‘自相矛盾’。”[详情]
北京时间10月19日凌晨,DeepMind 如约公布了他们最新版AlphaGo论文,文中透露最新版本的AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个神经网络,3天训练后就以100比0击败了上一版本的AlphaGo,也就是那个4-1战胜李世石的版本。 今年5月乌镇围棋大赛时,DeepMind CEO哈萨比斯表示,将在今年晚些时候公布战胜了柯洁的那版AlphaGo的技术细节。今天,这个承诺如约兑现,DeepMind将他们最新的内容发表于Nature的一篇论文中,详细介绍了迄今最强大的一版AlphaGo—— AlphaGo Zero。 AlphaGo Zero完全不依赖于人类数据,仅在条件确定的情况下进行自我对弈训练,也就是通常我们所理解的“左右互搏”。一开始它只是一个初学者,但是随着数据和训练的积累,AlphaGo Zero很快掌握了下棋的技巧。由最开始的关注吃子,逐渐摸索到势与地这些围棋最难判断的技术区域。 仅仅3天的训练过后,AlphaGo Zero就能以100-0击败第一次人机大战时4-1击败李世石的版本,也就是AlphaGo Lee(V18)。训练21天后,它就已经达到AlphaGo Master的水准。随后的AlphaGo Zero经过继续训练,已经远远超过Master的水准。 (文玄)[详情]
Copyright © 1996-2017 SINA Corporation, All Rights Reserved
新浪公司 版权所有