那个创造AlphaGo横扫围棋界的人 现在怎么样了

那个创造AlphaGo横扫围棋界的人 现在怎么样了
2021年09月07日 17:49 新浪体育综合

  在一次演讲中,商汤科技联合创始人、中国人工智能顶级教授汤晓鸥,讲了这么一个案例,2014年,有一家公司叫DeepMind,只有12个员工还没有赚钱,只是在用深度学习玩游戏和下棋,但谷歌果断花了6亿多美金收购了这家公司。

  汤教授要表达的意思是尊重原创,能花几百万美金挖人的事,用6亿多美元收购,是对原创最大的尊重。

  实际上,谷歌如果不花大代价收购,很难获取技术,别看这家公司天天“不务正业”玩游戏,人家创造的产品在全球引起轰动——打遍围棋天下无敌手的AlphaGo。

  最近,这家公司又在玩游戏上有了突破,通过游戏“元宇宙”让AI会玩各种游戏。

  AI玩游戏,不仅可以自己玩,还可以和队友组队,而且为了完成游戏,还会不按套路出牌,比如比赛谁先登顶,AI直接“杀”了对手另一个AI,场中只剩它一个。

  这家公司的核心是其创始人戴密斯·哈萨比斯,被称为“地球最聪明的人之一”、人工智能界的天才,说服霍金接受人工智能,让李嘉诚专门请他去讲课。

  今天带大家看看戴密斯开挂人生。

  01、4岁自学国际象棋,两周后打败成年人

  戴密斯出生于1976年7月,是家里的老大,还有一个妹妹和弟弟,父亲是希腊与塞浦路斯混血,母亲是新加坡华人,两人都是普通教师。

  他算是家里的“奇葩”,一家五口人,就他的脑袋长得比较“奇特”。“我的父母恐惧科技,很明显,我就是家中的那只黑天鹅。我完全不知道自己的个性从何而来。”他说。

  4岁的时候,看别人下国际象棋,戴密斯看着看着就学会了,两周后,就在比赛中赢了成年人。有人会问,会不会有点神化戴密斯,有可能,但聪明是真的。

  6岁赢得伦敦8岁以下锦标赛冠军,9岁成为当时象棋领域世界第二的英国的11岁以下国家象棋队队长后,开始思考两个问题:大脑是如何完成复杂任务的?电脑能不能也做完成复杂任务?

  除了思考科学家应该思考的问题,戴密斯看了编程书后,又在想如何才能在游戏中无限续命。小孩子想在游戏中无限续命,这是正常想法,但大多数人想的是我能不能去找个外挂,戴密斯想的是,我能不能找到方法背后的逻辑。

  于是,靠着在国际象棋比赛中赢得奖金,他买了人生第一台计算机 ZX Spectrum,开始研究编程。

  13岁的时候,戴密斯在14岁以下组的国际象棋比赛中,拿到了全球第二名的成绩。16岁的时候,只用一年完成高中学业,被剑桥大学计算机科学专业录取。

  在剑桥读书期间,他在英国一家游戏公司里,主导开发了主题模拟游戏《主题公园》,玩家可以在游戏里按照自己的想法建设公园,这款游戏在1994年发行了几百万份,累计发行超1500万份,在当时,跟现在的《王者荣耀》《绝地求生》一样火。

  从剑桥大学毕业后,戴密斯创办了自己的游戏公司“仙丹工作室”,高峰时公司员工达到了60人,估值1200万英镑,开发出了被英国电影和电视艺术学院奖提名的AI模拟游戏如“共和国:革命”和“邪恶天才”等。

  生意做着做着,戴密斯觉得知识不够用了,22岁的年纪,其他人本科还没毕业,他又跑去伦敦大学学院读神经学博士。

  戴密斯选择的研究方向是海马体的记忆和导向功能,他说:“我选择了一些我们不太了解的区域和功能。”没想到这个研究还真被他研究出了点东西,他发现5位失忆症患者因为海马体受损而很难想象未来事件。他的研究成果在2007年被顶级学术期刊《科学》评为“年度突破”。

  02、说服霍金,被谷歌收购,靠玩游戏成为AlphaGo之父

  在剑桥大学的时候,戴密斯发现了一个新的游戏:围棋。当时超级计算器“深蓝”第一次在同等条件下打败了国际象棋全球第一人加里·卡斯帕罗夫,引发轰动。戴密斯就想将来得开发一款打败围棋选手的程序。

  从伦敦大学学院毕业,拿到神经学博士学位后,戴密斯结合了之前的计算机科学和现在的神经学,开始了新的研究方向——人工智能。

  说起人工智能,就得说说霍金,霍金和特斯拉的创始人马斯克之前非常反对人工智能,还成立了反人工智能联盟。戴密斯找到霍金这位有卓越贡献的科学家前辈,经过4个小时的劝说,劝说内容无从得知,但最后霍金改变了想法,对哈萨比斯的相关研究表示关注和支持。

  2010年,戴密斯成立了DeepMind,主攻AI。有趣的是,人工智能的反对者马斯克,成了DeepMind的早期投资人。

  就如本文一开始说的那样,12个人的工作就是用深度学习玩游戏和下棋,这要搁不懂行的人眼里,就是瞎胡闹,玩游戏就玩游戏,还搞得这么高深,就算游戏玩的再好,将来能有出息吗?

  没想到,这个巅峰时期不到20个人的小公司,还真在游戏上玩出了出息。

  2013年12月,在一个业界领先的机器学习研究大会上,戴密斯演示了一个软件,这款软件的程序不仅可以玩雅达利的三款经典游戏――乒乓球、打砖块和摩托大战,而且玩了一段时间后,找出得分的方法,比人玩的还好。

  加州大学的人工智能专家斯图亚特·拉塞尔教授表示:“人们有点震惊,因为他们并未料想到我们能在现阶段技术水平下做到这种程度。我想,人们惊呆了吧。”

  外行看热闹,内行看门道,业内的人一下发现了宝矿,一个月后,谷歌直接以6亿多美元收购了DeepMind。在2014年的温哥华TED大会上,谷歌执行总裁佩奇赞不绝口:“长久以来我见过的最令人兴奋的事件之一”。

  兴奋的事接二连三,被谷歌收购后,研究经费充足,戴密斯这群人继续让AI深度学习怎么玩游戏。2016年3月,DeepMind推出了AlphaGo,翻译为阿尔法狗,彻底震惊全球。

  阿尔法狗先是与围棋世界冠军、职业九段棋手李世石进行人机大战,以4比1的总比分获胜。接着在中国棋类网站上注册账号Master,连战60局无一败绩。再接着在2017年的中国乌镇围棋峰会上,与排名第一的世界围棋冠军柯洁对战,3比0完胜。

  一波激起千层浪,阿尔法狗被公认为围棋水平超越人类围棋顶尖水平,柯洁说:“在我看来它就是围棋上帝,能够打败一切。”

  03、烧钱的AI,研究与赚钱如何平衡?

  每个企业或者研究机构或者院校,研究AI都有不同的方向,比如科大讯飞研究的是语音识别,商汤科技研究的是视觉处理,DeepMind研究的是将机器学习和系统神经科学结合起来。

  DeepMind玩游戏是高手,但总不能玩游戏烧钱,资金只出不进,看到市场上AI与K12结合后很火,戴密斯就也跟风研究了一下,结果发现,跟市场上宣传的有点不一样:AI就是个数学学渣。

  DeepMind参考英国16岁学龄儿童的数学考试,打造了一个包括算数、概率、代数、微积分等题型的200万题库,这项庞大的习题库让AI很迷茫,刷题对AI来说也是很难受,除了简单的算数问题,排列组合等,遇到复杂的题目,混合计算的题目等,AI还不如高中生。

  数学是一项复杂的推理游戏,需要计算能力、逻辑能力、认知能力,还有语言或图形与数字的转换等,显然目前的AI还不具备这么复杂的能力。而且,AI没有记忆力,做错的题下次遇到还会按照以前的逻辑来运算,如果不改变逻辑的话,永远都是相同的错误答案。

  去年年底,DeepMind宣布在生命科学领域有所突破,人工智能系统“AlphaFold”参加了由结构预测关键评估组织(CASP)的一项如何计算蛋白质分子3D结构的竞赛,并且预测准确性达到前所未有的水平。

  对于上述的研究成果,中科院院士施一公教授给了高度评价:“依我之见,这是人工智能对科学领域最大的一次贡献,也是人类在21世纪取得的最重要的科学突破之一,是人类在认识自然界的科学探索征程中一个非常了不起的历史性成就。”

  DeepMind在AI方面的研究,离不开“玩游戏”,戴密斯曾说:“游戏是有效开发和测试通用算法的理想平台,但是对于科学问题的研究成果能够更好地应用到现实世界中。”

  最近,戴密斯在“玩游戏”方面又有了新突破,DeepMind方面介绍,为“AI智能体”搭建了一款具有数十亿任务的游戏“元宇宙”,元宇宙里都是AI没有玩过的游戏。

  在一个游戏里,AI小人在抓捕对手的时候,给身后挡了一块扳子,做了个掩体,防止对方发现自己,在丢失目标后,没有四处搜寻目标,而是爬到了游戏“制高点”,找到了对手。

  在另一个游戏里,两个AI小人比赛登顶,一个AI小人找到地方爬上去后,另一个AI小人才赶到,按理来说,后到的AI小人已经输了,但没有,后到的小人直接将前面到的小人干掉了,高台上只剩下自己。

  玩过70万个游戏,完成340个独特任务,训练了2000亿次训练后,AI智能体学会了相互合作、博弈,其思考逻辑接近人类的脑回路,更加“多才多艺”。

  DeepMind介绍说,这样的训练是为了让AI智能体可以零样本学习。

  DeepMind的研究在不断突破,但戴密斯的心情比较烦闷,当初如果不被谷歌收购,估计实验室早就没钱破产了,被谷歌收购,有了资金支持,但却受金主干预。

  谷歌让戴密斯接手其机器人部门波士顿动力,戴密斯认为波士顿动力没什么AI含量,接手了耽误自己的时间,直接拒绝了。

  谷歌云那段时间业绩不太好,谷歌想让DeepMind给谷歌云背书,比如打上“Powered by DeepMind”这样的字样,戴密斯又拒绝了,觉得谷歌云市场目标不明确,会影响自己的声誉。

  有传闻称,在被收购之初,双方签署了一份《道德与安全审查协议》,协议规定DeepMind的人工智能研究及其应用将由一个主要由 Google 高级管理人员组成的道德委员会审查,委员会成员包含DeepMind的三位创始人。

  自从被收购以后,DeepMind与谷歌摩擦不断,主要体现在,DeepMind是一个烧钱的实验室,自己又没赚钱的能力,只能靠谷歌不断贴钱,戴密斯希望能独立运营,科学研究不应受到单一企业实体的控制。但谷歌并不想让DeepMind脱离自己的掌控,我拿钱支持你做研究,你帮我做一些事很正常,比如优化现有的业务。

  戴密斯建立的实验室类似于大学实验室,追求的是“通用智能”,如果这项研究能达到一个高度,对人工智能的影响可谓是十分巨大,但同样的,目前不能将技术转化为产品,不能靠技术盈利,而谷歌显然不会用巨大的财力和时间去赌DeepMind能成功。

  如何平衡研究与赚钱,这个问题显然比“玩游戏”更让戴密斯头疼。

推荐阅读

阅读排行榜

体育视频

精彩图集

秒拍精选

新浪扶翼