据重庆日报报道。
■这一研究成果,将会帮助机器更好地理解人类文字(语言),并广泛应用于服务领域:帮助企业判断客户风险、审计内部文档合规、从语义层面查找相关信息;在社交软件、推荐引擎软件内辅助文字审阅工作,让人类从枯燥的人工文字工作中解放。
本报讯 (首席记者 陈钧 实习生 唐璨)继国际象棋、围棋、游戏等领域之后,人工智能首次在深度阅读理解方面超越人类。3月8日,中国人工智能“国家队”云从科技和上海交通大学联合宣布,在自然语言处理(NLP Neuro-Linguistic Programming)上取得重大突破,在大型深层阅读理解任务数据集RACE数据集(Reading Comprehension dataset collected from English Examinations)登顶第一,并成为世界首个超过人类排名的模型。
重庆日报记者了解到,云从科技和上海交通大学的这次突破意义重大,甚至被人评论认为,这会是机器深层理解人类语言的开端。
论文中,云从科技与上海交通大学基于原创DCMN算法,提出了一种全新的模型,使机器阅读理解正确率提高了4.2%,并在高中测试题部分首次超越人类(机器正确率69.8%、普通人类69.4%)。
这一研究成果,在应用领域搭配文字识别OCR/语音识别技术后,NLP将会帮助机器更好地理解人类文字(语言),并广泛应用于服务领域:帮助企业判断客户风险、审计内部文档合规、从语义层面查找相关信息;在社交软件、推荐引擎软件内辅助文字审阅工作,让人类从枯燥的人工文字工作中解放。
此次云从科技和上海交通大学在自然语言处理(NLP)领域的深度阅读理解上登顶RACE排行榜第一名。RACE是一个来源于中学考试题目的大规模阅读理解数据集,包含了大约28000篇文章以及近100000个问题。它的形式类似于英语考试中的阅读选择题,给定一篇文章,通过阅读并理解文章,针对提出的问题从4个选项中选择正确的答案。该题型的正确答案并不一定直接体现在文章中,只能从语义层面深入理解后,通过分析文章中线索并基于上下文推理,选出正确答案。相对以往的抽取类阅读理解,算法要求更高,被认为是“深度阅读理解”。云从科技和上海交大通过一种首创的文章、问题、答案间的匹配机制让机器在庞大的题库中找到答案。