机器是如何“阅读理解”的？| NLP基础

最新推荐文章于 2022-12-08 17:00:30 发布

叶锦鲤

最新推荐文章于 2022-12-08 17:00:30 发布

阅读量1.7k

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YeJuliaLi/article/details/103966452

版权

本文探讨了机器如何进行“阅读理解”，以NLP模型如BERT、XLNet和RoBERTa为例，指出这些模型在SQuAD等阅读理解挑战赛中已超越人类。SQuAD是一个问答数据集，评估模型从文本中找出准确答案的能力。尽管机器在某些指标上超过了人类，但其理解方式更类似于基于规则的匹配，而非真正理解内容。

摘要由CSDN通过智能技术生成

NLP基础系列

1. 浅论语言与认知的关系

2. 为什么要处理自然语言

3. 计算机是如何理解自然语言的

4. 文本标注十要点

5. 把自然语言文本转换为向量

6.句子相似度的计算

机器是如何“阅读理解”的？

2019 NLP模型集体超越人类？

对人工智能领域而言，刚刚过去的2019年，堪称NLP（自然语言处理）年。在这一年里，Bert，XLNet，GPT-2等NLP模型、工具大放异彩，竞相占据各大AI头条。

一众NLP模型虽然属于相互竞争的关系，但至少从媒体报道的角度来看，在阅读理解这件事情上，它们都已经战胜了一个共同的对手：人类。

早在2018年1月，微软亚洲研究院的R-NET在SQuAD 机器阅读理解挑战赛（SQuAD machine reading comprehension challenge）上达到EM：82.650的好成绩，超越同期人类表现。

2018年10月，Google AI基于BERT的混合模型，在SQuAD1.1数据集上，获得EM：87.433，F1：93.160分的历史最佳成绩，进一步超越同期人类表现。

2019年6月，同样是Google推出的XLNet在SQuAD等数据集上的成绩超越了Bert（就更不用说人类了）。

不过才一个月后，Facebook基于BERT开发的RoBERTa模型就在SQuAD等多个榜单上实现了反超XLNet的结果。

下图是今天：2020年1月10日SQuAD 2.0数据集的榜单。大家可以看到，从数据上看，这些模型都已经超越人类啦！

最低0.47元/天解锁文章

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

叶锦鲤 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。