朱晨光-机器阅读理解:算法与实践读书笔记《第1章 机器阅读理解与关键支撑技术》概要
本章读书笔记是依据笔者自己阅读整理的,基于但并不完全等于章节内容,依据章节内容删减而成。
第一章主要分三个部分,机器阅读理解的基本概念、测评方式及其支撑技术。
下面我们先看下机器阅读理解的基本概念。
机器阅读理解的基本概念
什么叫机器阅读理解
机器阅读理解,顾名思义,就是给定文章和问题,需要自动回答该问题的最终答案是什么。从机器阅读理解的模型角度来说,输入是文章和问题,输出是问题对应的答案。从整体架构上来说,机器阅读分为三个部分:
- 编码层(对文章和问题进行单词编码,并完成上下语义分析)
- 交互层(处理文章和问题之间的关联信息,找出文章中与问题相关的线索)
- 输出层(将之前处理的信息按照任务要求生成答案)
机器阅读理解的应用
机器阅读理解具体可以有什么作用呢,或者应用在哪些方面呢,这里列举几个例子:
- 搜索引擎,可以利用阅读理解在文档中查询答案
- 客户服务,在产品文档中找到用户描述问题相关的解决方案
- 智能医疗,依据患者的描述及病情,找到可能的病因并输出诊疗方案
- 智慧教育,批改作业并给出改进意见
机器阅读理解任务的测评方式
评估指标设计
对于如何测评机器阅读理解,我们先看下实际问题中一般的参考答案形式有哪些,列举如下:
- 多项选择式。即模型从给定若干选项中选出正确答案。
- 区间答案式。即答案限定为文章中的一个子句,模型需要在文章中标出正确答案的起始位置和终止位置。
- 自由回答式。即模型依据自己的理解自由生成语句。
- 完形填空式。即原文中除去若干词,模型填入正确的单词或者短语。
不同的参考答案有不同的测评方式,这里做一个总结:
类型 | 评测方式 | 计算方式 |
---|---|---|
多项选择式 | 准确率 | 将模型答案直接与标准答案进行比较 |
区间答案式 | 准确率、召回率、F1-score | 将模型答案直接以字符串形式与标准答案进行比较 |
自由回答式 | 单词水平的匹配模式(ROUCE、BLEU、METEOR) | 是以元组和语义为单元查看预测答案在标准答案中所占的比例 |
数据集汇总
阅读文章的形式 | 含义 | 典型数据集代表 |
---|---|---|
单段落式 | 阅读给定的一个文本段落后回答问题 | RACE、NewsQA、CNN/Daily Mail、SQuAD、CoQA |
多段落式 | 阅读给定的多个文本段落后回答问题 | MS MARCO、DuReader、QAngaroo、HotpotQA |
文本库式(开放域机器阅读理解) | 需要先根据问题在文本库中利用检索方法找到相关的段落或者文章,然后进一步分析确认答案。(最贴近在线搜索问答等实际应用的一种数据集形式) | ARC |
支撑的技术
主要支撑技术有NLP技术(信息检索、问答系统、文本分类、机器翻译、文本摘要、指代消歧等)、深度学习技术等。
总结
本章读书笔记主要从机器阅读理解的基本概念、测评方式及其支撑技术三个方面进行介绍。其中,机器阅读理解的基本概念主要介绍了机器阅读理解的定义和机器阅读理解的应用,机器阅读理解任务的测评方式主要介绍了对于不同类型的阅读理解任务来说,设计不同的评估指标。也介绍了基于不同类型的阅读理解任务的代表性数据集。最后介绍了支撑的技术,主要为自然语言处理技术和深度学习编码技术。