论文笔记:Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a Tracker

作 者:崔金满
单 位:燕山大学


论文地址:https://arxiv.org/pdf/2105.14924.pdf

代码地址:https://github.com/RunxinXu/GIT (Will be released soon)

数据集:Chinese financial documents


在这里插入图片描述

Abstract

篇章级事件抽取旨在从整篇文章中识别出事件信息。现有的方法面临的两个挑战是:

① 目标 事件元素可能分散在各句子之间,需要模型对cross-sentence的上下文有全面的理解;

② 一个文档中可以同时包含多个相关事件,对事件之间的相互依赖关系进行建模仍然是篇章级事件抽取的一项挑战;

本文提出一种基于异构图的带有跟踪器的交互模型(GIT)来解决上述问题。

Introduction

事件抽取的大部分方法关注于句子级EE,即从单个句子中提取事件。然而,在实际应用场景中,大多数事件元素分布在不同句子中,导致句子级EE模型很难抽取元素位于不同句子中的事件,因此篇章级EE逐渐受到关注。

目前,已经有很多研究者针对篇章级事件抽取(DEE)任务提出自己的方法:如Yang et al[1], Zheng et al[2], Du and Cardie[3],Du et al[4]等。

本文提出GIT模型实现DEE,贡献为:① 构建了一个具有提及节点和句子节点的异构图交互神经网络,从全局角度联合建模文档中的实体和句子,从而捕捉分散在不同句子中的事件元素的全局上下文;② 为了便于多事件提取,提出了一个Tracker模块,用一个全局记忆模块连续跟踪提取记录,捕获事件之间的相互依赖关系。

Methodology

本文实现DEE任务的目标是处理三个子任务:1)实体提取,即从文档中提取实体作为候选参数;2)事件类型检测;3)事件记录提取,即从实体中为所表达的事件寻找合适的参数。GIT首先通过句子级神经提取器提取语义实体,然后构建一个异构图来建模句子和实体提及之间的交互,并检测文档所表达的事件类型,最后,引入Tracker模块,用全局记忆连续跟踪所有记录,并利用记录之间全局相关性进行多事件提取。
在这里插入图片描述

Entity Extraction


首先使用transformer对句子 进行编码,然后将实体提取视为BIO模式的序列标注任务,利用CRF来识别实体。

在这里插入图片描述

Heterogeneous Graph Interaction Network


异构图 G G G包含文档中的实体提及节点和句子节点,并且多个实体提及和句子之间的交互可以被明确地建模。其中,实体节点嵌入 h e 0 = M e a n ( { g j } j ∈ e ) h_e^{0}=Mean(\left\{ g_j \right\}_{j\in e}) h

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值