1 简介
论文题目:Entity, Relation, and Event Extraction with Contextualized Span Representations
论文来源:EMNLP 2019
论文链接:https://aclanthology.org/D19-1585.pdf
代码链接:https://github.com/dwadden/dygiepp
1.1 创新
- 提出一个多任务框架,用于命名实体识别、关系抽取、事件抽取。
2 背景知识
Coreference resolution (共指解析)是自动识别表示同一个实体的名词短语或代词,并将它们归类。
3 方法
整个框架如上图所示,总共分为下面四部分:
- Token编码:使用BERT对当前句子window内的句子进行编码。
- 区间枚举:使用左端点和右端点的token表示和区间的宽度编码,表示一个文本区间。
- 区间图传播:在共指传播图(邻居为共指提及)、关系传播图(邻居为相关实体)、事件传播图(触发词与论元互为邻居)中,每一个区间表示
g
j
t
g^t_j
gjt通过邻居区间更新。每个区间表示由当前的更新和原巨剑表示,更新的计算公式如下:
- 多任务分类:全连接层对不同的任务进行分类。
4 实验
在不同数据集上的实验结果:
在NER上的实验结果:
在关系抽取上的实验结果:
在事件抽取上的实验结果:
不同window size的实验结果
领域相关的pretraining bert的实验效果(SciBERT在大规模的科学出版物上训练):
可视化分析