1 简介
论文题目:A General Framework for Information Extraction using Dynamic Span Graphs
论文来源:NAACL 2019
论文链接:https://arxiv.org/pdf/1904.03296.pdf
代码链接:https://github.com/luanyi/DyGIE
1. 1 创新
- 提出一个框架进行命名实体识别和关系抽取,使用动态区间图进行传播全局上下文信息(共指解析作为辅助任务)。
2 方法
整个实验框架如上图所示,总共分为下面5部分:
- token表示层:每个token编码包括GLove和ELMO,然后经过双向LSTM编码。
- 区间表示层:每个区间表示包括左右结点的token表示、an attention-based soft “headword和区间的长度特征编码。
- 共指传播层:每个区间的更新部分的计算公式如下(其中
P
C
t
(
i
,
j
)
P^t_C(i,j)
PCt(i,j)为共指分数):
- 关系传播层:关系区间的更新部分的计算公式如下(V_R^t表示不同关系类型的分数,
A
R
A_R
AR帮助学习不同的表示(对于一个关系区间,不要求两个结点表示相似)):
下面公式对区间进行更新:
- 预测层:分类层进行分类。
loss函数如下:
3 实验
在不同数据集下的实验效果:
重叠实体抽取的实验效果:
消融实验结果:
共指传播在实体抽取的消融实验结果如下:
关系传播在关系抽取中的消融实验结果如下:
迭代次数的实验结果: