日本GLOBIS-AQZ项目发布会 力争围棋AI世界冠军

日本GLOBIS-AQZ项目发布会 力争围棋AI世界冠军
2019年04月19日 10:27 新浪体育综合
发布会现场 发布会现场

  文章来源:找借口安静

  4月18日,在日本棋院发布了以围棋AI世界冠军和培养年轻棋手为目标的“GLOBIS-AQZ”项目。该项目有经营学院GLOBIS,围棋AI“AQ”的开发者山口祐,日本棋院以及围棋AI“Ryanz”开发的风险企业3-ize共四家一同承担。而职业棋手大桥拓文六段将担任技术指导一职。

  以下是发布会的演讲内容,至于新闻发布会的内容打算择期再发(太长了)。一些专业术语因为本人智商有限可能不准确,请各位能理解。

  松村真美子:首先欢迎各位参加,围棋AI“GLOBIS-AQZ”项目的发布会,我是本次的主持人GLOBIS的松村真美子,请多关照。下面有请堀义人作为GLOBIS的代表进行发言。

  堀义人:首先欢迎各位今天参加围棋AI“GLOBIS-AQZ”——冲击世界冠军项目的发布会。下面由我来简单地对该项目进行简单的说明。去年的9月14日我来到中国深圳的腾讯公司,和“绝艺”开发团队进行了面谈。在那一次面谈的时候,我听到一句话就是,在2年前,腾讯决定开发围棋AI之后,在开发中用AlphaGo的论文进行参考,然后成功成为了世界冠军,但是在那个时候还没有出现关于人工智能的工程师。事到如今人工智能对腾讯来说已经是密不可分的关系了。

  对此我受到很大启发,所以我回国之后就和大桥拓文进行了联络,然后大桥拓文就向我介绍了山口祐。山口祐是目前日本顶尖AI“AQ”的开发者,我在和山口祐交流之后,山口祐说凭一己之力开发了“AQ”,当然和腾讯一样,参考AlphaGo的论文进行了研发。不过他也表示以自己的力量已经很难让“AQ”得到提升,然后需要一个团队进行支援,并且自己也想换一个新的目标,所以我们就达成了共识决定一同开发。我在和腾讯进行交流有11天,就聚集了包括我们GLOBIS的成员,决定开始这样一个项目。之后又从开发“Ryanz”的团队,TRIPLE-IZE的福原智收到了希望一同合作的联络,于是他们也加入了我们的团队。

  这样一来日本围棋AI的第一和第二就选择了共同合作,之后又得到了日本棋院的原幸子常务理事的同意,以及与产业技术综合研究所达成合作,又联系了东京大学的松尾仁。就这样形成了该项目的研发阵容。

  该项目由GLOBIS、AQ和TRIPLE-IZE共同研发。然后加上产业技术综合研究所的共同研究,东京大学松尾研究所的合作以及日本棋院的合作以及培养年轻棋手的产业链。

  现在纵观世界围棋AI,当今美国Facebook的“ELF”,中国腾讯的“绝艺”,以及欧洲比利时的“Galaxy”(译者:堀义人同学难道不是LeelaZero么???)等各国都在持续研发的情况下,我们日本的GLOBIS-AQZ项目将目标放在夺得世界冠军上。而我们从起初的单智能体系统(Single-agent system),提升到全新的多智能体系统(Multi-agent system),关于技术上的内容我们就有山口祐为大家进行介绍。

  我们GLOBIS在这个项目中有两个任务,将目标不单单放在简直世界冠军上面,首先我们要努力培养年轻棋手,今天代表日本参加GLOBIS杯世界围棋U20锦标赛的上野爱咲美和六浦雄太也来到了发布会现场。我们以培养年轻棋手为目标,才创办了“GLOBIS杯”的比赛。另一方面自己也担任日本棋院的理事一职,所以希望通过这个项目,能对培养年轻棋手起到帮助。

  另一方面我们GLOBIS也是一个教育机构,我们不仅将围棋运用到教育上,我还觉得围棋和经营也有很多相似处。当然我和我的孩子们都会下围棋,我觉得围棋和经营的逻辑方式相当接近。所以我觉得开发围棋AI和经营AI的开发是有直接联系的。所以我们在开发围棋AI的同时,在将来我们也对经营类的AI进行开发。我们GLOBIS也有GLOBIS人工智能经营教育研究所,我们在这里采用自然语言处理技术,让它对汉文书籍进行解读。今后我们希望AI能对经营模式得出自己的见解。所以我们在研发围棋AI的同时,培养年轻棋手,然后希望人工智能今后在经营上也有所作为。

  对我来说,开发围棋AI就相当于F1一样,曾经参加过F1赛事的丰田、本田车队,他们参加F1并非是为了争夺冠军而参加,而是通过这一系列的开发,研发出各式各样的引擎,在技术上进行进一步革新。而我们的围棋AI也一样,因为有很多例如Facebook、Google、腾讯等公司也加入到了研发围棋AI的阵营中,所以我们也希望通过研发围棋AI的同时,进行一些技术上的革新,然后能运用在教育、经营等行业上。

  关于相关的技术问题,之后由山口祐会和大家进行详细说明。我在此想表达的就是,我们的“GLOBIS-AQZ”项目要力争世界冠军,所以请各位多多关照。谢谢大家。

  松村真美子:谢谢。下面有请山口祐,对本次项目的概要进行说明。

  山口祐:我是“GLOBIS-AQZ”项目的负责人山口祐。非常感谢各位今天参加本次发布会。下面由我对该项目的开发部分进行详细说明。

  我发言的内容分三部分,首先是“GLOBIS-AQZ”的目标和开发体制,然后是围棋AI的学习手段以及今后的安排,最后是围绕对棋手们的指导帮助进行说明。

  首先由我来介绍一下世界的围棋AI现状。相信大家都知道,2016年,Google旗下的DeepMind团队开发了AlphaGo出现之后,并且超过了人类棋手。在此之后很多企业和团队也开始进行了围棋AI的开发,例如Facebook、腾讯等IT的大手企业也参与了进来,他们利用了自己的技术和计算资源投入到围棋AI的开发中。

  现在很多围棋AI的实力已经超越了人类棋手,在世界大赛上也有很多精彩的交锋。但是相较于中国、美国等目前对围棋AI投入较大的国家,最近很难看到由日本开发的围棋AI在世界大赛中出现。

  于是我们就开始了“GLOBIS-AQZ”的项目,然后以我个人开发的“AQ”作为基础,这款软件在去年的世界大赛上夺得了亚军的成绩,当然现在电脑围棋的水平逐年升高,我的话也意识到了已经来到了极限。所以通过这个项目,将目前的资源能够被最大化的利用,而这一次项目的关键点就在于有多家团队对该项目进行共同开发。GLOBIS,我和TRIPLE-IZE一同对该项目进行开发。共同开发的目的不仅可以相互分担任务,提高效率,并且利用大规模的计算资源进行强化学习,以此来开发力争世界冠军的围棋AI。

  该项目的目标我们分为两部分,首先是在今年的世界AI围棋大赛中夺得冠军,该比赛在今年8月份在中国进行,希望在那次比赛中能展现出比他们更优秀的水平。然后就是最近有很多年轻棋手涌现了出来,为了他们更好的学棋,想要为他们制造出更有力的围棋AI。

  关于该项目的开发体制,GLOBIS、TRIPLE-IZE和我进行对程序进行开发。具体来说我们从基础设施,到中间设备,再到数据分析以及数据可视化,和学习算法系统进行分工。在这些开发系统之外,我们还有需要一个大规模的计算资源,对此我们利用了产业技术综合研究所的“ABCI”的GPU客户端,对围棋AI进行强化学习。

  然后我们对“GLOBIS-AQZ”的系统构造进行简单的说明。围棋AI主要有两大部分,首先是引擎部分,也就是我们实际用来下棋的部分,以及引擎内部的学习系统。而这个引擎部分就利用我开发的“AQ”程序,而这一次我们会利用大数据进行强化学习。而譬如强化学习、分散、程序表和等级的计算就由各个公司分担进行。

  然后我们再对如何进行学习进行说明。这一次的主要内容还是和AlphaGo一样,认为强化学习依旧是当前最有利的技术。强化学习就是在环境内对智能体的状态进行观测,以及进行反复操作。从围棋的角度来说,就是在某一局面下算出最好的手段,并且得出胜负值。我们就以此为基础对程序进行强化学习。当然了,围棋的局面数量相当庞大,如果要对大规模的数据进行计算,需要有非常强大的计算资源。比如AlphaGo的计算,如果让一台普通的电脑进行计算的话需要花费3000多年的时间。所以我们需要有一个更加高效的计算手段,这也是我们今后的一大课题。

  我们将用产业技术综合研究所的“ABCI”作为我们的计算资源。而“ABCI”有1088台服务器,半精度演算能达到550PFlops,是日本国内的最高性能。当然该项目不会利用全部资源,将利用一部分资源进行开发。我们会使用数百台GPU服务器进行开发,而该计算已经进入了开始阶段。这里的一大关键点就是需要有庞大的计算量,所以在参数学习和自我对局的分散和合并程序也起到关键作用。目前该手段正处于预备实验阶段。我们通过“ABCI”进行该项目的参数学习,以及对棋谱和局面进行自我对局。目前我们利用数百台服务器进行自我对局,并且用一台服务器用于参数学习。

  关于该项目的日程表的话,现在已经进入了项目的预备实验阶段。从去年到今年进行了对学习程序的开发,4月份开始正式开始学习模式。当然了,一般的棋盘是19乘19共有361个交叉点,但是考虑到有可能会出现相当多的各种实验和参数调整,所以我们用9路盘的小棋盘进行一系列实验。而这个过程大概要花费1个月的时间,之后我们再用到19路盘上进行正式的操作。

  我们在小棋盘上对超参和程序进行比较,并利用多智能体系统作为辅助。AlphaGo则是利用了单智能体系统进行一系列的操作,但是最近的强化学习都会利用多智能体系统进行学习,能变得更加高效和迅捷。所以我们也将把该技术利用到围棋AI上去。在此之后我们花4个月时间在19路盘进行操作,面对在8月中旬的世界赛事进行一系列强化学习工作。

  还有就是围绕如何对人类棋手进行支援上面,我来说明一下围棋AI对人类棋手有何影响。Facebook对人类棋手的手段变化进行了统计,在AlphaGo出现之后,更多职业棋手在研究AlphaGo的棋谱之后,可以看出一致率(44%→48%)和恶手率(3.1%→2.7%)都有非常明显地变化。这能看出人类棋手们正积极地对AI的手段进行学习和采纳,可以看出人类棋手的手段受到了围棋AI的很大影响。今后随着更多强有力的AI出现,我觉得这个数据还会有更大的变化。

  在此当中,希望“GLOBIS-AQZ”成为世界最好的围棋AI。另一方面我们也希望棋手们能积极地利用这个程序进行学习。具体来说,我们将国际象棋,将棋和西洋双陆棋等已经明显超过人类的棋类进行参考,参考人类棋手是如何从电脑进行学习,希望该项目也能达到这样的效果。当然电脑目前还不能和人类进行沟通,为了让人类能直观地理解电脑,我们会采用相应的输入和输出,或者对结果的保存以及分享,还有就是显示端的操作等内容进行设计。另外我们也会利用云端,将高昂的GPU费用尽可能廉价化。我们的最终目标还是,能让所有人可以自由自在地利用围棋AI,并且希望出现仅通过对围棋AI的学习成为职业的棋手。我的发言就到这里,谢谢大家。

  松村真美子:感谢山口祐的发言,接下来有请日本棋院常务理事原幸子发言。

  原幸子:我是日本棋院常务理事原幸子。今天原本是日本棋院理事长小林觉参加这次发布会,但是因为有海外出差的工作,所以由我来替小林觉进行发言。

  “GLOBIS、山口祐、TRIPLE-IZE和产业技术综合研究所一同开发围棋AI,并且剑指世界冠军一事上,对此表示十分期待。GLOBIS公司通过‘GLOBIS杯’的平台,为培养年轻棋手做出了应有贡献。而在‘GLOBIS-AQZ’项目上,贵公司也希望以此培养年轻棋手,对此表示十分感谢。借此机会,我也期待年轻棋手们能在世界大赛上有更好的表现。AlphaGo之后,棋手开始学习围棋AI的手段,人类以往的想法也发生了相当大的改变。不仅是围棋,人类的智慧,以及我们和人工智能的相处方式也得到了相应地发展,期待未来能变得越来越好。公益财团法人日本棋院理事长,小林觉。”

  以上就是我要发言的内容。

  松村真美子:非常感谢,当然今天来到发布会的还有日本棋院所属的棋手,同时担任本次项目技术指导一职的大桥拓文六段。下面有请大桥拓文六段发言。

  大桥拓文:各位早上好,我是担任“GLOBIS-AQZ”技术指导的大桥拓文六段。请多关照。我们棋手自从AlphaGo出现之后,整个围棋界都发生了巨大的变化,我觉得用180度大转弯来形容也不为过。在这样的环境下,我们目前的目标是“人机合一”的话题上。特别是在中国,人工智能的利用得到了快速发展,刚才提到有棋手利用腾讯“绝艺”进行了2000盘对局并夺得世界冠军,也有很多拼命从人工智能学习,希望自己能更进一步的棋手。可以看出如何对人工智能的利用,对今后的围棋界产生重大的影响。从棋手的角度来看,我认为目前的世界格局,就是围绕人类和人工智能如何成为一体,然后形成一种良性循环。所以在此非常感谢GLOBIS能开设该项目,然后AQ的山口祐以及TRIPLE-IZE的福原智,包括东京大学的松尾仁以及产业技术综合研究所的支持,让我们感受到全日本对该项目进行支持,作为棋手也非常期待。然后明天还有GLOBIS杯的赛事,期待能见证围棋AI的世界冠军,以及日本棋手在世界大赛上夺冠的身影。谢谢大家。

  松村真美子:感谢大桥拓文六段。之后有请该项目的负责人之一,TRIPLE-IZE的CEO福原智发言。请多关照。

  福原智:我是刚刚主持人介绍的,TRIPLE-IZE的福原智。今天就由我对“GLOBIS-AQZ”——为了世界冠军一题进行发言。

  我在去年发表了《科技第一印象》一书,针对日本企业为什么不愿涉及AI,区块链和IoT发表了感想。我在书中举了55年前,本田宗一郎宣布自己要制造赛车参加赛车比赛,刚刚堀义人也举出了类似的例子,而我对冲击世界冠军抱着很大的希望,又在GLOBIS堀义人的邀请下,如愿走在了一起。我们TRIPLE-IZE从2014年开始对围棋AI进行开发,在2017年和2018年,与山口祐的“AQ”也有过交手。然后也和腾讯的“绝艺”,以及清华的“星阵”也有过交手。很早以前我们还是领先于他们,但是在2017年和2018年,他们以巨大优势战胜了我们之后,对此表示相当懊恼。所以想到我们不得不使用日本的大型服务器,才能和他们进行抗衡。这一次我们团队主要负责的是该项目的主要算法和构造的技术支持,以及等级分的计算和可视化。

  我的话,对日本的IT产业的真正价值感到怀疑,并且要向世界展示日本的能力。围棋虽说是游戏,但是围棋AI绝不是游戏,我们要竭尽所能对该项目提供支持。

  在欧美,国际象棋被认为是果蝇类的遗传学研究,而果蝇类的研究也因此展开。在AI的话我们用过游戏的方式进行研究,以此我们体会到AI的重要性,并且认真地对该项目提供支持,并且希望最终能夺得世界冠军。请各位多多关照。

(责编:樊璐璐)

推荐阅读

阅读排行榜

体育视频

精彩图集

秒拍精选

新浪扶翼