©PaperWeekly 原创 · 作者 | werge
研究方向 | 自然语言处理
传统事件抽取任务一般分为的事件检测(ED, Event Detection)和事件论元抽取(EAE, Event Argument Extraction)两个子任务。前者用于识别事件触发词并对其对应的事件类型进行分类;后者则主要用于提取触发词对应的论元及其角色。事件抽取任务一般使用多个分类任务框架建模,或者采用统一的生成式方法。
这两种范式都同时学习事件检测和事件论元抽取的共享表示,然而这两个子任务具有不同的特征依赖,共享表示的使用会降低它们的性能。类似的问题也存在于实体关系抽取等任务中。因此,使用独立的编码器来分别建模不同的子任务会有助于提高任务性能 [1][2]。
为了解决事件抽取任务中不同子任务之间的特征干扰问题,本文提出了一个简单而实用的混合框架。该框架使用独立编码器来分别建模事件检测和事件论元抽取,并通过广泛的实验研究分类方法和生成方法之间的差异。
实验结果表明,在 token-classification 任务中,分类方法优于生成方法,而生成方法在建模事件论元抽取时更为有效,因此,本文在模型中使用了两个不同类型的解码器:一个分类式解码器用于事件检测,一个生成式解码器用于事件论元抽取。此外,本文还设计了一个桥接机制来增强这两个任务之间的交互,并使用双阶段训练方法来指导事件检测的学习。
本文在 ACE05-E、ACE05-E+ 和 ERE-EN 三个基准测试集上进行了评估,实验结果表明,本文提出的模型在 ACE05-E 和 ACE05-E+ 上建立了新的最佳结果,并在 ERE-EN 数据集上取得了可比较的效果。
论文标题:
A Hybrid Detection and Generation Framework with Separate Encoders for Event Extraction
论文链接:
https://aclanthology.org/2023.eacl-main.231.pdf
Method
本文提出的框架 HDGSE3(Hybrid Detection and Generation Framework with Separate Encoders for Event Extraction) 如下图所示: