什么是机器阅读理解？跟自然语言处理有什么关系？

最新推荐文章于 2023-07-06 15:45:29 发布

VIP文章大数据v

最新推荐文章于 2023-07-06 15:45:29 发布

阅读量1.4k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zw0Pi8G5C1x/article/details/105852029

版权

导读：机器阅读理解（Machine Reading Comprehension，MRC）是一种利用算法使计算机理解文章语义并回答相关问题的技术。由于文章和问题均采用人类语言的形式，因此机器阅读理解属于自然语言处理（Natural Language Processing，NLP）的范畴，也是其中最新、最热门的课题之一。

近年来，随着机器学习（Machine Learning），特别是深度学习（Deep Learning）的发展，机器阅读理解研究有了长足的进步，并在实际应用中崭露头角。

本文将介绍机器阅读理解任务的相关概念，并讨论这项课题所涉及的自然语言处理这项关键支撑技术。

作者：朱晨光

来源：大数据DT（ID：hzdashuju）

01 机器阅读理解任务

学者C. Snow于2002年发表的一篇论文中将阅读理解定义为“通过交互从书面文字中提取与构造文章语义的过程”。而机器阅读理解的目标是利用人工智能技术，使计算机具有和人类一样理解文章的能力。

图1所示为机器阅读理解的一个样例。示例中，机器阅读理解模型需要用文章中的一段原文来回答问题。

▲图1 机器阅读理解任务样例

1. 机器阅读理解模型

机器阅读理解模型的输入为文章和问题文本，输出为最终的回答。为了完成任务，模型需要深度分析文章语义以及文章和问题之间的联系，然后根据文章中的内容作出准确回答。

当前，绝大多数机器阅读理解算法均采用深度学习模型，利用深度神经网络进行建模与优化。深度学习的特点是，模型能根据训练集上预测的准确度直接优化参数，不断提高模型性能，从而达到很好的效果。

由于深度学习需要在数值空间处理信息，因此阅读理解模型首先要对文章和问题进行数字化表示，形成文本编码。常见的方法是词向量（word vector）：将文本分成若干单词，然后用一串数字（即一个向量）表示一个单词。

文本的数字化表示：分词与词向量

原文：今天天气真好
分词：今天|天气|真|好
词向量：
今天：[3.2, -1.5, 6.0]
天气：[-0.2

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
什么是机器阅读理解？跟自然语言处理有什么关系？

导读：机器阅读理解（Machine Reading Comprehension，MRC）是一种利用算法使计算机理解文章语义并回答相关问题的技术。由于文章和问题均采用人类语言的形式，因此机...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。