朱晨光-机器阅读理解:算法与实践读书笔记《第1章 机器阅读理解与关键支撑技术》

朱晨光-机器阅读理解:算法与实践读书笔记《第1章 机器阅读理解与关键支撑技术》概要


本章读书笔记是依据笔者自己阅读整理的,基于但并不完全等于章节内容,依据章节内容删减而成。
第一章主要分三个部分,机器阅读理解的基本概念、测评方式及其支撑技术。
下面我们先看下机器阅读理解的基本概念。

机器阅读理解的基本概念

什么叫机器阅读理解

机器阅读理解,顾名思义,就是给定文章和问题,需要自动回答该问题的最终答案是什么。从机器阅读理解的模型角度来说,输入是文章和问题,输出是问题对应的答案。从整体架构上来说,机器阅读分为三个部分:

  • 编码层(对文章和问题进行单词编码,并完成上下语义分析)
  • 交互层(处理文章和问题之间的关联信息,找出文章中与问题相关的线索)
  • 输出层(将之前处理的信息按照任务要求生成答案)

机器阅读理解的应用

机器阅读理解具体可以有什么作用呢,或者应用在哪些方面呢,这里列举几个例子:

  • 搜索引擎,可以利用阅读理解在文档中查询答案
  • 客户服务,在产品文档中找到用户描述问题相关的解决方案
  • 智能医疗,依据患者的描述及病情,找到可能的病因并输出诊疗方案
  • 智慧教育,批改作业并给出改进意见

机器阅读理解任务的测评方式

评估指标设计

对于如何测评机器阅读理解,我们先看下实际问题中一般的参考答案形式有哪些,列举如下:

  • 多项选择式。即模型从给定若干选项中选出正确答案。
  • 区间答案式。即答案限定为文章中的一个子句,模型需要在文章中标出正确答案的起始位置和终止位置。
  • 自由回答式。即模型依据自己的理解自由生成语句。
  • 完形填空式。即原文中除去若干词,模型填入正确的单词或者短语。

不同的参考答案有不同的测评方式,这里做一个总结:

类型评测方式计算方式
多项选择式准确率将模型答案直接与标准答案进行比较
区间答案式准确率、召回率、F1-score将模型答案直接以字符串形式与标准答案进行比较
自由回答式单词水平的匹配模式(ROUCE、BLEU、METEOR)是以元组和语义为单元查看预测答案在标准答案中所占的比例

数据集汇总

阅读文章的形式含义典型数据集代表
单段落式阅读给定的一个文本段落后回答问题RACE、NewsQA、CNN/Daily Mail、SQuAD、CoQA
多段落式阅读给定的多个文本段落后回答问题MS MARCO、DuReader、QAngaroo、HotpotQA
文本库式(开放域机器阅读理解)需要先根据问题在文本库中利用检索方法找到相关的段落或者文章,然后进一步分析确认答案。(最贴近在线搜索问答等实际应用的一种数据集形式)ARC

支撑的技术

主要支撑技术有NLP技术(信息检索、问答系统、文本分类、机器翻译、文本摘要、指代消歧等)、深度学习技术等。

总结

本章读书笔记主要从机器阅读理解的基本概念、测评方式及其支撑技术三个方面进行介绍。其中,机器阅读理解的基本概念主要介绍了机器阅读理解的定义和机器阅读理解的应用,机器阅读理解任务的测评方式主要介绍了对于不同类型的阅读理解任务来说,设计不同的评估指标。也介绍了基于不同类型的阅读理解任务的代表性数据集。最后介绍了支撑的技术,主要为自然语言处理技术和深度学习编码技术。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值