World Knowledge for Reading Comprehension: Rare Entity Prediction with Hierarchical LSTMs

最新推荐文章于 2021-03-16 15:03:06 发布

彭伟_02

最新推荐文章于 2021-03-16 15:03:06 发布

阅读量413

点赞数

分类专栏： DL MRC NLP 文章标签： MRC

本文链接：https://blog.csdn.net/ganxiwu9686/article/details/93200078

版权

NLP 同时被 3 个专栏收录

68 篇文章 6 订阅

订阅专栏

28 篇文章 2 订阅

订阅专栏

MRC

26 篇文章 1 订阅

订阅专栏

《World Knowledge for Reading Comprehension: Rare Entity Prediction with Hierarchical LSTMs Using External Descriptions》

这篇文章是发表在2017年ACL上的，和KBLSTM那篇同时期。属于阅读理解当中完形填空类的问题，针对稀少实体进行预测任务。在提出的层级lstm模型上取得了很好的效果。

分以下四部分介绍：

Motivation
Model
Experiment
Discussion

1、Motivation

想法是，在人们去进行阅读理解的时候，会带有特定的背景知识，我们希望在自动阅读理解系统当中也能达到同样的效果。
针对阅读理解当中的实体预测，在CNN/Daily Mail数据集中，大部分问题能够被解决，但是还有一些残留的问题。比如实体出现的次数过少，模型往往预测称频率大的实体；由于实体匿名化，导致实体之间的一些必要联系（知识）被忽略。
针对这个问题引入外部知识，考虑带有解释的实体字典。下图是一个例子。

2、Model

输入是文档还有候选实体及其解释。
输出是候选中每个实体对应的概率。

语料构建
首先从html文本当中解析网页数据，并且抽取出他们的内容。在内容当中涉及到的含有超链接的实体（Wikipedia）会被标记，并且用一个特别的符号blank表示，得到训练语料。实体的链接定义形成实体字典。

对于实体的候选集合确定，可以有几种方法。

第1种方法是记录所有语料中的实体，这种方式过于复杂，计算量较大。
第2种方法是针对当前的文档，提取当中的实体，形成当前的实体候选集。即每一篇文档都有一个实体候选集。

2.1 overview

提出了两种模型：

Double Encoder
Hierarchical Double Encoder——文档之间信息并不是独立的，考虑了层次间的交互。

2.2 Double Encoder

将一篇文档D根据标记“blank”分成若干个片段：在这里插入图片描述
Le表示e这个实体对应的Definition：

在这里插入图片描述
首先找到实体词对应的解释，把这个解释通过一个循环神经网络得到他的表示 $d_e$ ，见图黄色部分。得到表示之后，把当前句子当中的blank替换成该表示然后计算一个新的隐状态， $h_i^e$ ，接下来计算一个概率函数即可。通过增加 $d_e$ 到P中，可以传递梯度到lexical encoder，两个modules可以共同学习。
在这里插入图片描述

2.3 Hierarchical Double Encoder

考虑到上一个模型，它是对每一篇文档去独立进行的，但是在文档之间可能会存在有用的信息帮助实体的预测。因此提出一种层次化的模型结构。
在这里插入图片描述
对每一篇文档中的每一个片段用上述的模型进行编码（蓝色部分）。得到 $h_i^e$ ，i表示第i篇文档，e表示候选中的某一个实体。为了得到这个文档的表示，我们简单地进行一个平均（绿色部分），然而也可以用一些attention的方法，但是复杂度较高。