EMNLP2020文档级关系抽取模型GLRE 论文Global-to-Local Neural Networks for Document-Level Relation Extraction

最新推荐文章于 2022-03-23 21:57:56 发布

iceburg-blogs

最新推荐文章于 2022-03-23 21:57:56 发布

阅读量1.5k

点赞数 2

分类专栏：自然语言处理文章标签：机器学习人工智能深度学习 java python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eagleuniversityeye/article/details/109624936

版权

文章目录

前言
1.摘要
2.模型
3.实验

前言

这是EMNLP2020一篇文档级关系抽取的论文，代码链接 https://github.com/nju-websoft/GLRE，这篇论文主要有三个亮点：

构建了异质图并使用了R-GCN进行特征传播，相较之前一些构建同质图然后做特征传播的模型，使用异质图可以融合更复杂的特征；
有一个本地表示层，通过自注意力的计算方式得到一个local entity representation，消融实验证明了这种方式可以提升关系推理的性能；
在关系分类时使用文档主题信息，计算关系向量对文档主题信息的注意力。

1.摘要

文档级关系抽取的目标是识别有多个句子的一篇文档中两个命名实体之间的语义关系，这需要复杂的实体关系推理。本文提出了一种新的文档级RE模型，通过对文档信息进行整体和局部两方面的信息表示进行编码，然后将实体的局部语义和全局语义表示拼接在一起得到实体对的表示，在和文档主题求注意力后进行关系分类。

2.模型

首先用BERT对输入文档以句子为单位编码，然后采用和19年EMNLP中的EoG模型一样的方式构建一个异质图，在异质图上使用R-GCN进行特征传播，接着使用一个本地表示层，最终拼接多个向量（局部表示和全局表示）得到实体对的表示，在对文档主体信息求注意力后进行关系分类。
在这里插入图片描述

2.1编码层

$D=[w_1，w_2，... w_k]$ 是输入文档，其中 $w j （ 1 \leq j \leq k ）$ 是其中的第 $j$ 个字。使用BERT对文档D进行编码：

在这里插入图片描述

其中 $h_j∈R^{d_w}$ 是在BERT最后一层输出的一系列隐藏状态。受BERT输入长度的限制，GLRE将一个长文档以短段落的形式顺序编码。

2.2全局表示层

这个模块构建了一个和EoG中相同的具有不同类型节点和边的全局异构图，以获取不同的依赖关系信息。在这个异质图中，有三种类型的节点：

提及节点（M节点），该节点对文档D中实体的不同提及进行建模。提及节点 $m_i$ 的表示通过对所包含单词的表示进行平均来定义。为了区分节点类型，拼接了一个节点类型表示 $t_m∈R^d_t$ 。因此， $m_i$ 的表示是 $n_{m_i}=[avg_{w_j∈m_i}（h_j）；t_m]$ ，其中 $[；]$ 是串联运算符。
实体节点（E节点），表示文档D中的实体。实体节点 $e_i$ 的表示是通过其所有提及的平均（将实体对应的所有提及向量做一个平均池化）和节点类型表示

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。