导 航
查看: 4430|回复: 4

祝贺!阿里AI打破SQuAD世界纪录 引领机器阅读理解准确率首超人类 全球AI领域重大突破

[复制链接]

classn_11

发表于 2018-1-14 09:19:07 | 显示全部楼层 |阅读模式
祝贺!世界人工智能取得重大突破!1月11日,由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD刷新排名,令业界振奋的是人工智能的阅读能力历史上首次超越人类。阿里巴巴凭借82.440的精准率打破了世界纪录,并且超越了人类82.304的成绩。

SQuAD的负责人Pranav Rajpurkar难掩兴奋之情。他在社交媒体上表示,2018年一个强劲的开始,第一个模型(阿里巴巴iDST团队提交的SLQA +)在精准度匹配上超越人类表现!下一个挑战:模糊匹配,人类仍然领先2.5分!

SQuAD比赛构建了一个大规模的机器阅读理解数据集(包含10万个问题),文章来源于500多篇维基百科文章。人工智能在阅读完数据集中的一篇短文之后,需要回答若干个基于文章内容的问题,然后与标准答案进行比对,得出精确匹配(Exact Match)和模糊匹配(F1-score)的结果。

SQuAD是行业内公认的机器阅读理解顶级赛事,吸引了包括谷歌、卡内基·梅隆大学、斯坦福大学、微软亚洲研究院、艾伦研究院、IBM、Facebook等知名企业研究机构和高校的深度参与。

此次技术的重大突破源于阿里巴巴研究团队提出的“基于分层融合注意力机制”的深度神经网络模型。该模型能够模拟人类在做阅读理解问题时的一些行为,包括结合篇章内容审题,带着问题反复阅读文章,避免阅读中遗忘而进行相关标注等。

模型可以在捕捉问题和文章中特定区域关联的同时,借助分层策略,逐步集中注意力,使答案边界清晰;另一方面,为避免过于关注细节,采用融合方式将全局信息加入注意力机制,进行适度纠正,确保关注点正确。

阿里巴巴自然语言处理首席科学家司罗表示,对于解决wiki类客观知识问答,机器已经取得非常好的结果,我们将继续向对通用内容的“能理解会思考”的终极目标迈进。今后,研发的重点在于把这项技术真正应用在广大实际场景,让机器智能普惠生活。

实事上,这项技术已经在阿里巴巴内部被广泛使用。比如,每年双11都会有大量的顾客对活动规则进行咨询。阿里小蜜团队通过使用司罗团队的技术,让机器直接对规则进行阅读,为用户提供规则解读服务,是最自然的交互方式。

再比如,顾客还会针对单个商品询问大量的基础问题,而这些问题其实在商品详情页都是有答案的。现在通过机器阅读理解技术,能够让机器对详情页中的商品描述文本进行更为智能地阅读和回答,降低服务成本的同时提高购买转化率。

由司罗领导的自然语言处理团队支撑了阿里巴巴整个生态的技术需求。由他们研发的AliNLP自然语言技术平台每日调用1200亿+次,Alitranx 翻译系统提供20个语种在线服务日调用量超过7亿+次。此前曾在2016年ACM CIKM 个性化电商搜索、2017年IJCNLP中文语法检测CGED评测、2017年年美国标准计量局TAC评比英文实体分类等大赛中取得全球第一的成绩。

classn_11

发表于 2018-1-14 09:35:44 | 显示全部楼层
需求驱动技术进步 阿里加油!

评分

1

查看全部评分

回复

使用道具 举报

classn_11

 楼主| 发表于 2018-1-14 09:36:58 | 显示全部楼层
如何市场化全面落地将成下一步研发重点
阿里巴巴自然语言处理首席科学家司罗表示,对于解决wiki类客观知识问答,机器已经取得非常好的结果,将继续向对通用内容的“能理解会思考”的终极目标迈进。今后,研发的重点在于把这项技术真正应用在广大实际场景,让机器智能普惠生活。
回复

使用道具 举报

classn_11

 楼主| 发表于 2018-1-14 10:28:43 | 显示全部楼层
中国多个团队排名前列
尽管阿里和微软是目前仅有的两个超过人类得分的团队,但是在自然语言处理领域,其实各方研究者的实力相当接近,竞争一直很激烈。
从SQuAD官网发布的榜单来看,去年11月和12月,得分纪录已经多次被刷新,其中来自中国和美国的团队占据了最前列的位置,包括腾讯、哈工大&科大讯飞等中国团队都取得了不错的成绩,一些欧洲、韩国和以色列的研究者同样榜上有名。
微软亚洲研究院副院长、自然语言计算组负责人周明博士表示:“祝贺中国的自然语言理解研究已经走在世界前列!整个领域的进步需要大家共同的努力和投入来推动。自然语言处理长路漫漫,让我们共勉。”
回复

使用道具 举报

classn_11

 楼主| 发表于 2018-1-14 10:30:45 | 显示全部楼层
AI阅读理解得分首超人类
由斯坦福大学发起的 SQuAD(Stanford Question Answering Dataset)挑战赛,被认为是目前全球最高水平的AI阅读理解赛事。
SQuAD官网显示,阿里巴巴 iDST NLP 团队提交的 SLQA +模型,1月5日在精确匹配(Exact Match)项目上获得了82.440的分数,刷新了微软亚洲研究院R-NET模型刚刚于1月3日创造的纪录。而这两个模型的成绩都超过了人类在该项目上的得分——82.304。
SQuAD阅读理解赛事是以超过500篇维基百科文章为基础,包含了超过10万个问题-答案组合,是目前世界最大的AI阅读理解数据集。
而且跟CNN/DM,CBT等自然语言处理类数据集相比,过往的数据集往往只是“完形填空”的形式,即要求AI将一个词语填写到文章空白处。而SQuAD则是真正的阅读理解,需要AI先读完一段文章,然后回答一个根据文章提出的问题。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|高楼迷 ( 鄂ICP备12012922号-1 )|粤公网安备 44088102000001号

GMT+8, 2018-10-23 04:51 , Processed in 0.049767 second(s), 10 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表