李宏毅nlp学习笔记10:QA(Question answering)

1.QA的基本流程:

问题的答案可能是明确的,也可能是有变化的。
答案给出的方式,可能是一个词,或者是一个单个的句子,
获取知识的来源,可以使文本,声音,搜索,视频。
在这里插入图片描述

答案形式部分:

2.输出的答案就是一个单词:

15年的一个数据集:BABI
在这里插入图片描述
做法:
在这里插入图片描述

3.选择题:

在这里插入图片描述

4.要给出的答案就在给出的文本中:

在这里插入图片描述
SQUAD:是针对英文的。
DRCD:是针对中文的。
找哪个token当做答案开头的概率最大,哪个token当做答案结尾的概率最大。
在这里插入图片描述

5.Free Answer Generation:

答案不在文章中
一种特殊的情况是答案分布在文章的不同位置。
其他特殊情况如下图小黑体字所示:
在这里插入图片描述

6.用seq2seq产生一个model:

S-net:

在这里插入图片描述

7.QA还需要考虑的一个特殊的问题:

并不是所有的问题都是有答案的:

当遇到这些问题的应该,应该不回答:

bert的做法,在文章里面加入一个特别的token:NULL
也就是:句子中加入CLS的作用在这里插入图片描述
其他模型,再训练一个决定问题能不能被回答的model:
在这里插入图片描述

还有的模型是把:问题,答案,文章 再一次的输入到另一个模型决定能否回答。
在这里插入图片描述

knowledge source 部分:

8.通过搜索引擎来查找问题的答案:

在这里插入图片描述
多个答案的话,需要评估每一个答案的可信度,选出正确的答案:
在这里插入图片描述
V-Net采用的方式是投票的方法:
在这里插入图片描述

9.还可以语音视频等,

过。

问题的类型:

在这里插入图片描述

10.Simple Questions:在这里插入图片描述

使用: Query-to-context:
在这里插入图片描述
第二版本:Question不是单个的向量,每个都与knowledge source做一次attention,得到的结果进行处理(如max),
在这里插入图片描述
context-to-Query:
在这里插入图片描述
相关的经典的架构:R-net
把上述两个attention结合起来,Bi-directional Attention Flow:
在这里插入图片描述

11.bert之前有很多的模型:

过。

12.bert:

bert效果好的原因就是:
**不但有Context-to-query, Query-to-context, **
还有Self
在这里插入图片描述

13.Complex Question:Reasoning。

相关的语料:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

14.Multiple-hop:

每次不是将直接提取到的答案直接输出,而是在进行更新的提取。
在这里插入图片描述
上述找答案的过程可以概括成如下的模型:
在这里插入图片描述
reasonet:让机器自己决定做几次上述的:
在这里插入图片描述

15.Graph Neural Network:

在这里插入图片描述
在这里插入图片描述

16.Dialog QA:

在这里插入图片描述
问题可能无法回答:
在这里插入图片描述

17.没有用bert的解决方式:

RNN:
在这里插入图片描述
self-attention:
在这里插入图片描述

18.使用bert家族的结果:

在这里插入图片描述

19.很奇怪的现象:

给模型看问题和文章进行训练。
只给模型看问题进行训练。
只给模型看文章进行训练。
只看文章有时竟然高于看问题和文章。
在这里插入图片描述

original是最原始的问题。
reduced:是做很简短的提问。
confidence:认为回答正确的概率。
竟然发现,reduced之后,分数有的上升了,有的只有稍稍的下降。
在这里插入图片描述

20.出现上述问题的原因是机器学错了特征,比如原来的语料中,一出现运动,答案基本上就是网球:

所以对语料进行如下改变:

在这里插入图片描述

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值