Double Graph Based Reasoning for Document-level Relation Extraction

Double Graph Based Reasoning for Document-level Relation Extraction

Shuang Zeng1,2∗, Runxin Xu1∗, Baobao Chang1,2†and Lei Li3
1Key Laboratory of Computational Linguistics, Peking University, MOE, China
2School of Software and Microelectronics, Peking University, China
3ByteDance AI Lab, China
{zengs,chbb}@pku.edu.cn runxinxu@gmail.com lileilab@bytedance.com

精简总结

本文提出了一种图聚合和参考网络(GAIN)用于篇章级的关系抽取。在公共数据集DocRED上进行了实验,结果表明比当前最好的模型有了F1(2.85)的提高。
https://github.com/DreamInvoker/GAIN

1 介绍

1.1 面临挑战

在文档级有效的关系抽取中有几个主要的挑战:

  1. 关系中涉及的主体和客体实体可能出现不同的句子中
  2. 同一实体可能在不同句子中被提及,为了更好地表示,必须聚合跨句子上下文
  3. 许多关系识别需逻辑推理技术

1.2 先前工作

  1. 没有考虑推理
  2. 仅使用基于图或分层的神经网络以隐式方式进行推理

2 任务制定

在这里插入图片描述

3 GAIN框架

3.1 模型构成

  1. Encoding module
  2. Mention module
  3. Entity module
  4. Classfication module

在这里插入图片描述

3.2 Encoding module

将文档在这里插入图片描述转换为向量序列在这里插入图片描述

在姚等人(2019)的基础上,对于D中的每个词,我们首先将它的词嵌入与实体类型嵌入和共指嵌入连接起来:

在这里插入图片描述
在这里插入图片描述

编码器可以用LSTM或其他模型替换。

3.3 Mention-level Graph Aggregation Module

为了对文档级信息以及提及和实体之间的交互进行建模,构建了一个异构提及级图(hMG)。
hMG有两种不同类型的节点:mention node 和 document node。 mention node代表每一个提及的实体,hMG还有一个document node来对文档进行整体建模。

hMG还有三种类型的边Edge:

  1. Intra-Entity Edge:同一提及实体相连
  2. Inter-Entity Edge:同一句子中的不同实体相连
  3. Document Edge:所有提及实体均与之相连

然后用一个Graph Convolution Network对所有来自邻居的特征进行聚合。
在这里插入图片描述
σ 是激活函数(e.g., ReLU).

3.4 Entity-level Graph Inference Module

一个实体可以通过融合来自其提及的信息来表示,这些信息通常分布在多个句子中。此外,潜在的推理线索由实体之间的不同路径来建模。然后,它们可以与注意机制相结合,这样我们就可以考虑潜在的逻辑推理链来预测关系。(详细推理过程见原文)

3.5 Classification Module

对于每个实体对(eh,et),我们连接以下表示:
(1)在实体级图中导出的头和尾实体表示,通过比较操作(Mou等人,2016)来加强特征,即两个实体的表示之间相减的绝对值,| eh-et |,以及元素方向的乘法,eh*et;
(2)文档节点在提及级图mdoc中的表示,因为它可以帮助聚合跨语句信息并提供文档感知表示;
(3)综合推理路径信息ph,t。

4 实验

4.1 数据集

我们在DocRED (Yao等人,2019)上评估了我们的模型,DocRED是一个基于维基百科和维基百科构建的用于文档级RE的大规模人类注释数据集。DocRED共有96种关系类型、132,275个实体和56,354个关系事实。DocRED中的文档平均包含8句左右,超过40.7%的关系事实只能从多句中提取。此外,61.1%的关系实例需要各种推理技能,例如逻辑推理(姚等人,2019)。我们遵循数据集的标准分割,3053个文档用于培训,1000个用于开发,1000个用于测试。关于DocRED更详细的统计,建议读者参考原论文(姚等,2019)。

4.2 实验设置

在我们的GAIN实现中,我们使用了两层GCN,并将辍学率设置为0.6,学习率设置为0.001。我们使用AdamW (Loshchilov和Hutter,2019)作为权重衰减为0.0001的优化器来训练GAIN,并在PyTorch (Paszke等人,2017)和(Wang等人,2019b)下实现GAIN。我们为GAIN实现了三种设置。GAIN-GLow使用GloV e (100d)和BiLSTM (256d)作为单词嵌入和编码器。GAINBERTbaseand和GAIN-Bertlarge分别使用BERTbase和BERTlargeas编码器,学习速率设置为1e 5。

4.3 对比实验

在这里插入图片描述

4.4 分析

在这里插入图片描述

5 结论

在文档级关系抽取中,抽取句间关系和进行关系推理是具有挑战性的。为了更好地处理文档级关系抽取,本文引入了图聚合与推理网络,该网络以不同粒度的双图为特征。增益利用一个异构的提及级别图来建模文档中不同提及之间的交互,并捕获文档感知特性。它还使用一个实体级图和一个建议的路径推理机制来更明确地推断关系。在大规模人工标注数据集DocRED上的实验结果表明,GAIN优于以前的方法,尤其是在内容和推理关系场景中。消融研究也证实了我们模型中不同模块的有效性。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
FTKernelAPI 是一套完全免费(对于非商业性程序而言)的实现了BitTorrent 网络协议的内核库。在兼容官方BitTorrent协议的同时针对国内的网络带宽状况进行了优化,增加了一个侦听端口支持多个任务同时运行, 文件选择下载,断点续传, 自动配置支持UPnP协议的路由器, 对于全局或者单个任务进行速度限制等功能。FTKernelAPI BT协议内核库以及示例源码 BitZam 的出现,使BT软件开发不再高深。只要你愿意,不必关心网络编程,BT协议,只需简单的调用FTKernelAPI的接口在3天的时间里就能开发出满足你自己需要的BT下载软件。假如你正在想自己开发一个BT下载软件或者你正在为你的公司的程序寻找一种省钱省时的下载解决方案, FTKernelAPI将是你的理想选择...FTKernelAPI 成熟可靠吗? 可以被那些开发语言使用?BT下载软件FlashBT(变态快车) 就是使用的本内核库. 从2004年开发至今,经过了大约100万以上用户的测试使用,已经非常成熟和可靠。而且作者长期从事P2P和IM软件的开发,积累了丰富的开发经验,还在不断的改进和完善FTKernelAPI 之中。FTKernelAPI 是使用C++开发, 以标准C API 接口的方式提供外部调用接口. 所以FTKernelAPI 不但可以应用于C++开发的程序中, 同样可以应用于VB/Delphi/C++ Builder 的语言开发的程序中. 目前FTKernelAPI 已经被国内和国外的几家公司成功的应用于他们的商业程序中, 包括C++和Delhpi开发的程序.FTKernelAPI 如何使用? 有什么例子可以参照吗?为了便于大家使用, 作者提供了一个使用FTKernelAPI 开发的开放源码的BT下载程序 - BitZam. 关于使用FTKernelAPI, 你可以下载BitZam的C++源码看看. 使用起来非常简单. 你可以在BitZam的基础上在很短的时间内开发出通用的BitTorrent下载程序或者自己专用的禁止其他人的BitTorrent软件下载的程序. 你不必再关心BitTorrent协议的细节, 这些都已经被封装在了内核库中.FTKernelAPI 和FlashBT的使用的内核有差别吗?FlashBT同样使用的是 FTKernelAPI 内核. 你得到的内核和FlashBT使用的没有任何差别. 这意味着, 只要你愿意, 你可以开发出和FlashBT一样强大的BT下载程序.FTKernelAPI 是完全免费的吗? 可以将它应用于商业程序中吗?对于非商业性非盈利性软件你可以自由免费使用它. 没有任何时间和功能限制. 对于商业性程序, 你只需要支付少量的费用,就可以获取到本内核库的商业使用权, 并且获得到作者的免费长期技术支持。另外对于商业应用的特殊需求,FTKernelAPI提供了特别的接口,就是使用FTKernelAPI可以制作出使用DE算法加密的只有FTKernelAPI能够识别和下载的Torrent件,保护您的商业利益不受侵犯!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值