作 者:崔金满
单 位:燕山大学
Abstract
在现实世界中,经常存在一个句子中包含多个事件的现象,提取多个事件比提取单个事件要困难,本文提出一种联合多事件提取框架,通过引入syntactic shortcut arcs来增强信息流,并通过基于注意力的图卷积网络来对图信息进行建模,从而联合抽取多个事件触发器和元素。
Introduction
在事件抽取中,一个句子中可能同时出现多个事件,由于这些不同类型的事件之间通常是相互关联的,导致提取困难。比如,“He left the company, and planned to go home directly.”,触发词left可以触发transport和end-position事件。但是,如果考虑到由触发词“go”触发的事件,就能更好的判断这是一个transport事件。
现有方法存在的问题: 基于序列标注的模型很难捕获句子中单词间的长期依赖关系,基于特征的模型需要耗费大量人力,而且特征的选择也会在很大程度上影响模型的性能。此外,这两类方法都不能充分对事件之间的关联建模。
一种直观的方法是引入由句法依赖树等语言资源表示的shortcut arcs,通过较少的转换将信息流从一个点转换的目标节点,这种方法可以减少同一个句子中,从一个事件触发器跳到另一个事件触发器的跳数。如上图,由触发词killed触发的Die事件到触发词barrage触发的attack事件,按照句子本身的顺序从killed到barrage需要6跳,而如果根据句法依存树只需要3跳(图中绿色框)。基于此,本文提出一种联合事件抽取框架,通过引入syntactic shortcut arcs来增强信息流,并通过基于注意力的GCN来对图信息进行建模。
贡献:① 提出一种新的基于句法结构的联合事件抽取框架,增强了信息流,缓解了多个事件同时出现在同一个句子中的现象。② 提出一种自注意力机制来聚合信息,保证事件之间的关联。
Approach
模型包含四个模块:(i)用向量表示句子的单词表示模块;(ii)句法图卷积神经网络模块;(iii)基于自注意力的触发器分类模块,用来捕获多个事件之间的关联;(iv)参数分类,预测每个提及实体在特定类型的候选事件中所扮演的角色。
Word Representation
w i w_i wi 词嵌入:Glove
w i w_i wi POS-tagging labe嵌入:查找初始化POS-tagging lable嵌入表
w i w_i