1 简介
论文题目:基于BERT的端到端中文篇章事件抽取
论文来源:CCL 2020
论文链接:https://aclanthology.org/2020.ccl-1.36/
1.1 创新
- 提出了一个篇章级别事件抽取语料集,事件定义为event = def(T,O,F,D,N),其中T为事件类型,O、F、D、N为事件中的4类角色。
- 提出了一个新的模型。
2 方法
模型主要包括输入编码层、事件检测层、事件元素识别层和元素角色识别层,模型结构如下图。
- 输入编码层:基于BERT对输入句子进行编码
- 事件检测层:进行多标签分类,设定一个阈值,大于改阈值即包含此事件类型。
- 事件元素识别层:根据事件类型向量和句子向量,标注事件元素(向量)
- 元素角色识别层:将实体向量和事件类型求和平均,当作注意力机制的Q,与句子向量进行进行attention得到特征向量,分类得到事件角色。
3 实验
事件检测的实验结果如下图:
篇章级别事件抽取的结果如下图。
单一事件与多事件的实验结果如下图。
主从事件识别:将文档标题中的事件作为主事件,其他事件作为从事件。根据相似度计算,衡量主事件与从事件的共指程度,取最高得分对应的那组事件为主事件,其余为从事件。结果如下图。
主从事件融合:通过计算不同事件中事件元素的语义相似度来衡量它们的共指程度,大于阈值则将对应的两个事件元素合并。结果如下图。