1 简介
论文题目:Textual Entailment for Event Argument Extraction: Zero- and Few-Shot with Multi-Source Learning
论文来源:NAACL 2022
组织机构:University of the Basque Country UPV/EHU
论文链接:https://aclanthology.org/2022.findings-naacl.187.pdf
代码链接:https://github.com/osainz59/Ask2Transformers
1.1 动机
- 目前信息抽取存在数据稀缺问题,信息抽取任务的标注依赖每个领域的模式,迁移学习需要人工的映射不同模式的标签。
1.2 创新
- 以文本蕴涵的方式解决事件论元抽取问题,使用文本蕴涵数据、关系抽取数据、其他事件抽取数据(如下图)提升事件论元抽取任务不同场景下(zero-shot、few-shot和全数据)的性能。
2 方法
整体框架如上图,包括下面几个部分:
- Label verbalization:人工根据数据集的指引创建模板(如上图,根据具体的模板格式,包括上下文、触发词、候选论元)。
- Entailment model:模型为文本蕴涵模型,训练时,将事件论元抽取数据集转换为自然语言推理格式,启发式地生成蕴含、中立、矛盾的假设,对于正例(候选论元是论元),使用相应标签的模板创建 N E N_E NE个蕴涵假设,使用不同角色的模板创建 N N N_N NN个中立假设,对于负例(候选论元不是论元),使用随机的模板创建 N C N_C NC个矛盾假设(为了得到有难度的负例使用constrained sampling);测试时大于阈值的类型为预测的类型。
3 实验
实验数据集为ACE和WikiEvents,主要关注句子级抽取,使用gold事件触发词和实体注释,实验结果入下图:
多资源情况下的实验结果:
消融实验:
不同模板开发人员对实验结果的影响:
创建模板和标注数据需要的时间对实验结果的影响: