Chapter7-10_Deep Learning for Question Answering (1/2)

最新推荐文章于 2024-05-14 18:58:08 发布

七元权

最新推荐文章于 2024-05-14 18:58:08 发布

阅读量261

点赞数

分类专栏：课程笔记-李宏毅文章标签：人工智能自然语言处理机器学习神经网络李宏毅

本文链接：https://blog.csdn.net/zjuPeco/article/details/113822350

版权

课程笔记-李宏毅专栏收录该内容

31 篇文章 17 订阅

订阅专栏

文章目录

1 什么是Question Answering(QA)
2 按答案分类
3 按source分类

本文为李弘毅老师【Deep Learning for Question Answering (1/2)】的课程笔记，课程视频youtube地址，点这里👈(需翻墙)。

下文中用到的图片均来自于李宏毅老师的PPT，若有侵权，必定删除。

文章索引：

上篇 - 7-9 Deep Learning for Dependency Parsing

下篇 - 7-11 Deep Learning for Question Answering (2/2)

总目录

1 什么是Question Answering(QA)

顾名思义，QA要做的事情就是回答问题。我们的问题类型大致可以分为三类。

可以从一个source中直接找到答案的问题，如"Who is the U.S. president?"
需要从多个sources中找答案的问题，如"Is Trump older than Obama?"
没有标准答案的问题，如"Who should pay for the date, and why?"

这些问题的答案都是从sources中整合出来的，sources可以是文本，语音，视频等等。现有的模型基本思路都是一致的，就是把sources放到一个类似BERT的模型里做embedding，同时也把question放到另一个BERT里做embedding，这两个module之间往往需要做一下attention，最后把两个modules的输出放到一个生成答案的module当中去，得到最终的答案。

答案也可以分为好几类。

一个词
source中的一段话
选择题的话就是一个或多个选项
也可以是生成的一个段落

2 按答案分类

2.1 答案是一个单词

早在2015年的时候，就有了一个测试QA的数据集bAbI，这个数据集把问题分成了20个类别，每个问题的答案都是一个单词。当时人们觉得要让机器自动回答出这些问题是非常困难的，但是如今这20类问题都被deep learning破解了，所以现在的paper也很少有拿bAbI来当数据集的。
7-10-2

这种答案只有一个单词的问题，就是一个简单的分类问题，训练一个模型，然后取概率最高的那个答案就可以了。
7-10-3

2.2 答案是多个选项

当答案为几个选项时，就要给模型增加一个choice的module。source，question和choice这三个module之间是有attention的。每次丢给choice module的输入是其中的一个选项，模型只需要输出yes或者no就可以了。这样的方式适用于选项数量会变，答案数量也会变的情况。
7-10-4

2.3 答案是source中的一段话

有一类答案必定是source中的一段话，典型的就有SQuAD和DRCD，这样的QA也被称为是extraction-based。对于这类答案，我们会给source中的每一个token输出一个start score和一个end score。分别取start score最大的和end score最大的，就是答案的头和尾了。
7-10-5
模型大概长下图这个样子，在没有BERT的时候，answer module是LSTM，而在有了BERT之后，就只需要是一个start vetor和end vector就可以了。
7-10-6

2.4 答案是生成的一段话

也有的答案的自由度比较高：

有可能是source中不同的spans拼凑起来的
有可能是答案是在问题和source之中的
有可能是部分答案在问题和source中都没有
有可能根据source根本得不到答案

这类问题比较经典的模型有MS MARCO和DuReader。有些人也会直接用extraction-based的方法来解决这个问题。
7-10-7

不管用何种方法，当答案不在source中时，模型会强行在source中找个答案，这也必定会犯错。为了解决这个问题，有人会在source中加一个Null的token，这样当Null的start score和end score都超过某个阈值时，就表示没有答案了。
7-10-8

如果不是extraction-based的方法，那就会对答案做一个额外的分类，判断有无答案。下图中上面的这个模型，会吃source，question和answer来验证答案对不对，不对的话就是没有答案；下图中下面这个模型会仅根据source和question来判断source中有没有答案。
7-10-9