dbRNN论文笔记
《Jointly Extracting Event Triggers and Arguments by Dependency-Bridge RNN and Tensor-Based Argument Interaction》
基于桥依赖RNN和论元张量交互的事件抽取联合模型
1.摘要
传统的事件抽取很大程度上依赖词汇和句法特征,需要大量的人工工程,并且模型通用性不强。另一方面,深度神经网络可以自动学习底层特征,但是现有的网络却没有充分利用句法关系。因此本文在对每个单词建模时,使用依赖桥来增强它的信息表示。说明在RNN模型中同时应用树结构和序列结构比只使用顺序RNN具有更好的性能。另外,利用张量层来同时捕获论元之间的关系以及其在事件中的角色。实验表明,模型取得了很好地效果。
2.引言
现有的事件抽取模型大都没有利用句法特征,并且没有考虑到论元和论元之间的交互作用。观察结果表明联合建模所有候选论元可以更加全面的了解论元之间的关系,有助于论元的识别和分类。
本文提出了dbRNN模型,在bilstm单元的基础上增加了单词之间的依赖桥信息。然后在每两个候选论元上建立一个张量层,来获取论元之间的信息交互。并且在ACE2005上取得了目前最好的效果。
3.任务描述
可将事件抽取任务分为以下三个子任务:
1.触发词识别
2.参数标识
3.参数分类
4.方法
4.1 LSTM
递归神经网络考虑了上下文的信息,适合于序列建模。但是存在反向传播过程中会出现梯度消失和梯度爆炸的问题。为解决此问题,提出