End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures

zycxnanwang

于 2019-08-28 16:52:18 发布

阅读量596

点赞数 1

分类专栏：机器学习文章标签：实体关系抽取联合学习树型LSTM 知识图谱实体识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zycxnanwang/article/details/100122449

版权

机器学习专栏收录该内容

31 篇文章 3 订阅

订阅专栏

End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures

概述

本篇论文应该是最早提出基于神经网络的联合学习(实体识别、实体关系抽取两个子任务联合学习)的方法。

主要的思想是序列LSTM和树型LSTM的叠加，主要的过程是，首先通过序列LSTM识别出相应的实体，然后

树型LSTM根据识别出来的实体结果，进行实体关系分类。两个LSTM之间共享编码层参数，具体的可以看下面

的总体结构图。下面详细讲一下框架的细节。

词嵌入层

词的向量表示融合了多种特征，包括词本身以及词性(part-of-speech)。

文章最后实验提到了用word2vec的结果初始化词向量。

序列LSTM

文章中用的序列双向LSTM是Graves在2013年提出的变体。在我上一篇写的文章Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification中也是用相同的框架，所以想了解变体的细节，可以参考我上一篇文章。

]

实体识别

文章中用的标注方法是BILOU(有点少见，一般是BIO,或者BIOMES), B：Begin(实体的开始位置)。I:Inside(实体内部位置) 。 L:Last(实体的最后位置)。O(不属于实体)。U(只有一个单词的实体标为U)。

将双向LSTM输出，作为两层神经网络的输出，得到最后的预测标签。具体两层神经网络如下公式

从公式中可以发现第一层神经网络的输入不光有 $s_t$ (双向LSTM的输出)，也有 $v_{t-1}^{(e)}$ ,上一个单词预测出的标签的嵌入

树型LSTM

根据依存关系，构建出关于两个实体的最短依存路径树。树形LSTM不仅可以从root向根节点传播，也可以从

根节点向root传播

重点两个LSTM的叠加

论文的主要思想是将树型LSTM叠加在序列LSTM上，树型LSTM中每个节点都融入了三种特征，一个是依存类型

$v_{t}^{d}$ , 一个是序列双向LSTM的输出 $s_t$ ,还有一个是预测的标签向量 $v_{t}^{(e)}$ 。融入这些特征后，除了依存类型，其他两个都能更新实体识别模型中的参数，所以模型是实体识别、实体关系抽取两个联合学习。

关系预测

在预测实体关系的时候，树型LSTM会有三个输出， $[\uparrow h_{P_A}; \downarrow h_{P_1}; \downarrow h_{P_2}]$

$\uparrow h_{P_A}$ 代表两个实体向上传播到根节点的输出， $\downarrow h_{P_1}; \downarrow h_{P_2}$ 分别代表根节点传播到两个实体叶节点的输出

之后经过类似于实体识别的两层神经网络，得到最后的输出

一个小改进

作者在实体关系分类的时候，只利用了实体的最后一个单词，忽略了其他单词，为了克服这个缺陷，树型LSTM

的输出中融入两个实体其他单词的嵌入。具体公式如下

一些疑惑

预测关系时，分配两个不同方向的标签。具体运行方式不明了。

Also, we assign two labels to each word pair in prediction since we consider both left-to-right and right-to-left directions. When the predicted labels are inconsistent, we select the positive and more confident label, similar to Xu et al. (2015a).

还有就是文章一直强调的依存树类型 SPTree, SubTree, FullTree.有点没有理解

论文地址

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。