1 简介
论文题目:DEGREE: A Data-Efficient Generation-Based Event Extraction Model
论文来源:NAACL 2022
组织机构:南加利福尼亚大学
论文链接:https://arxiv.org/pdf/2108.12724.pdf
代码链接:https://github.com/PlusLabNLP/DEGREE
1.1 动机
- 高质量的事件标注是昂贵的,仅使用少量标注的数据训练高效的事件抽取模型是一项重要的挑战。
1.2 创新
- 提出一种基于生成的事件提取模型,通过更好地结合标签语义和子任务之间的共享知识,可以用更少的数据学习。
2 方法
模型的整体框架如上图,通过对passage和prompt进行enocder和decoder,从输出中得到事件信息,prompt包括三部分:
- Event type de nition:对给定事件类型进行解释。
- Event keywords:与给定事件类型语义相关的三个词,从注释指南中收集在例句中作为触发器出现的三个单词。
- E2E template:该模板定义输出的格式,包括两个部分,事件检测为“Event trigger is <Trigger>”,第二部分对应论元抽取,该模板与第一部分的事件类型相关,如上图所示,使用“some-”开头的不定代词作为占位符,对应一个论元角色。如下表:
如果相同角色存在多个论元,则用"and"连接,如果存在多个触发词,则输出多个E2E template。推理时枚举全部的事件类型,每个事件类型生成一个输出,如果预测的string在文本中出现多次,匹配最靠近触发词的论元。
为了进行消融实验,将上述的模型DEGREE改成了pipline的方式,分别解决事件检测和论元抽取。
事件检测的prompt的设计如下:
- Event type de nition:与DEGREE相同。
- Event keywords:与DEGREE相同。
- ED template:该模板为DEGREE模板的第一部分,为“Event trigger is<Trigger>”
论元抽取的prompt的设计如下:
- Event type de nition:与DEGREE相同。
- Query trigger:指出该事件类型的触发词,如“The event trigger word is detonated”中的触发词detonated。
- EAE template:该模板为DEGREE模板的第二部分。
3 实验
实验数据集为ACE 2005和ERE,低资源环境下的实验结果如下图:
高资源环境下的实验结果如下图:
高资源环境下论元抽取的实验效果如下图:
消融实验:
不同模板设计对实验结果的影响: