文章目录
1 简介
论文题目:GENERATING DISENTANGLED ARGUMENTS WITH PROMPTS: A SIMPLE EVENT EXTRACTION FRAMEWORK THAT WORKS
论文来源:ICASSP 2022
组织机构:北京航空航天大学
论文链接:https://arxiv.org/abs/2110.04525
代码链接:https://github.com/RingBDStack/GDAP
1.1 动机
- 先前基于生成的事件抽取方法专注于在解码期间结合标签语义(作为约束),但未能在编码端充分利用此类信号(事件类型和触发词)。
- 生成模型假设触发词和参数抽取之间的依赖关系,因此可以串行或联合实现这两个模块,然而在一些例子中触发词对论元抽取是无帮助的(语法和语义方面),甚至一些触发词和论元是重叠的。
1.2 创新
- 提出一个基于prompt的事件抽取方法,将触发词抽取和论元抽取分离开,并行的进行。
2 方法
模型的整体框架如上图,主要包括事件类型检测、触发词抽取和论元抽取三部分(Encoder-Decoder结构参数不共享)。
2.1 Event Type Detection
事件类型检测输入为原始文本,输出格式为事件类型(如下图),使用(和)分割,使用有限自动机得到事件类型,解码时防止字词字典合并生成的token不属于候选事件类型,使用tire-based约束解码算法。
2.2 Trigger Extraction
触发词抽取输入为文本和事件类型的拼接,使用< /s>分割(图1),输出为触发词列表(图2),触发词全部来自输入文本,解码与上一阶段一致,使用有限自动机和tire-based约束解码算法。
![]() |
![]() |
2.3 Argument Extraction
论元抽取的输入为事件类型、论元角色和文本的拼接(图1),输出为论元列表(图2):
![]() |
![]() |
在触发词抽取和论元抽取中,在训练时使用负采样机制,对于每个文本,随机抽取N个该文本中不出现的事件类型进行训练,此时模型应该生成空的序列,为(())
3 实验
实验数据集为ACE 2005,全部baseline不适用gold实体,实验结果如下图:
消融实验: