论文笔记 AAAI 2019|One for All: Neural Joint Modeling of Entities and Events

hlee-top

已于 2022-03-30 23:43:40 修改

阅读量766

点赞数 1

分类专栏： NLP 论文文章标签：深度学习自然语言处理事件抽取

于 2022-01-20 16:33:13 首次发布

本文链接：https://blog.csdn.net/o11oo11o/article/details/122591170

版权

NLP 同时被 2 个专栏收录

125 篇文章 15 订阅

订阅专栏

论文

125 篇文章 12 订阅

订阅专栏

文章目录

1 简介

论文题目：One for All: Neural Joint Modeling of Entities and Events
论文来源：AAAI 2019
论文链接：https://arxiv.org/pdf/1812.00195.pdf

1.1 创新

提出一个模型，联合解决实体提及检测(Entity Mention Detection)、事件检测和论元预测三个子任务，在ACE 2005数据集上达到SOTA。

2 方法

在这里插入图片描述
模型的整体框架如上图，主要包括下面5个部分：

句子编码：对于每个词 $w_i$ ，拼接两种向量表示，1)预训练词编码 $d_i$ 。2)POS tag和chunking tag。
句子表示：使用GRU对句子进行编码，得到 $H=h_1,h_2,.....,h_n$ 。模型的目标是输入句子W，联合预测实体、触发词和论元。公式如下，其中 $a_{i,j}$ 为token $w_j$ 在触发词 $w_i$ 事件中的论元角色，如果满足下面三个条件之一，则为"Other"。1)i=j;2) $w_i$ 不是触发词;3) $w_j$ 不是实体提及的开始token。
实体提及检测：对于每个词 $w_i$ ,概率计算公式如下(其中 $R_i^{EMD}=[h_i,D_i]$ , $D_i$ 为当前词周围window内词向量的拼接)，然后使用维特比解码。
触发词和论元预测：对于当前词，尝试计算的概率如下式；对于事件检测，假设事件触发词为单个的token，在训练中使用真实的实体，评测式使用上一阶段预测的实体，概率公式为 $P(t_i|E,W,a_{<i},t_{<i})=FF^{ED}(R_i^{ED})$ ,其中 $R_i^{ED}=[h_i,D_i]$ ，最后使用贪婪解码；对于论元预测，公式为 $P(a_{ij}|E,W,a_{i,<j},a_i,t_{<i+1})=FF^{ARP}(R_{ij}^{ARP})$ ,其中 $R_{ij}^{ARP}=[h_i,D_i,h_j,D_j,V(e_i^p),V(t_j^p),M_i,B_{ij}]$ ,其中 $V (x)$ 将标签转换为向量表示，在训练中 $e_i^p,t_j^p$ 使用真实标签， $M_i$ 为二进制向量，表示当前步骤i之前出现的事件类型和论元角色。 $B_ij$ 为二进制向量，捕捉token i和j直接的特征(如依赖路径、上下文单词)，最后使用贪婪解码。