MultiPLe: Multilingual Prompt Learning for Relieving SemanticConfusions in Few-shot Event Detection

第32届ACM信息与知识管理国际会议(CIKM '23)论文集MultiPLe: Multilingual Prompt Learning for Relieving Semantic Confusions in Few-shot Event Detection | Proceedings of the 32nd ACM International Conference on Information and Knowledge Management

创新点

事件检测(ED)是信息提取领域一项极具挑战性的任务。针对传统的事件检测模型在多义词和同义词方面存在语义混淆的问题且少提示词情况下加大了对语义的混淆,提出了一种用于少量事件检测(FSED)的多语言提示学习(MultiPLe)框架,包括三个组成部分,即多语言提示、分层原型和四元对比学习模块。

多语言提示模块通过多语言消歧义和预训练语言模型中的先验知识来开发触发器的上下文语义。然后,采用分层原型模块,将捕捉到的最底层语义与模糊触发器的标签细粒度地连接起来,从而减少同义词混淆。最后,我们采用四元对比学习模块来解决标签表示不足和潜在噪声的问题。在两个公开数据集上进行的实验表明,MultiPLe 在加权 F1 分数上优于最先进的基线算法,FSED 的最大改进率为 13.63%。

现有的事件检测方法主要应用神经网络来捕捉单语文本中的语义信息,如卷积神经网络(CNN)[3, 18]、循环神经网络(RNN)[9, 17]、图神经网络(GNN)[15, 19, 20]等。然而,它们在事件检测中仍然存在语义混淆的问题,这是由单语线索有限的混淆触发器引起的。

混淆包括多义词混淆和同义词混淆

框架模块作用

 a multilingual prompt module:多语言提示模块旨在应对单语言场景中出现的多义词混淆问题。具体来说,它将最初的单语文本扩展为多语文本集,为多义词触发提供有价值的信号。然后,它驱动一个跨语言预训练语言模型(PLM)来获取先验知识,以捕捉上下文语义和模糊触发器的可区分特征。

a hierarchical prototype module:为了处理同义词混淆问题,我们提出了基于两级原型网络的分层原型模块,以更精细的粒度建立混淆触发器及其相应标签之间的联系。

a quadruplet contrastive learn- ing module:最后,我们精心引入了四元对比学习模块,以增强标签表示,并同时消除多语言提示模块可能带来的潜在干扰。

The main contribution

首次 少样本事件检测中的语义混淆

提出了一种多语言提示来缓解多义词混淆,并设计了一个分层原型模块来缓解同义词混淆。此外,我们还使用了四元对比学习模块来增强标签表示和去噪干扰。

在两个公开数据集(ACE-2005 and FewEvent)上进行了综合实验,以验证 MultiPLe 在 FSED 中缓解混淆的有效性。

RELATEDWORK

Few-shot event detection models
Prompt-based event detection models
Confusions in NLP

APPROACH

然后在§3.1中介绍了MultiPLe的框架。我们将以多语言提示(§3.2)、分层原型(§3.3)和四元对比学习模块(§3.4)的形式详细介绍 MultiPLe。

训练流程

Task formulation and model framework
Multilingual prompt

首先使用传统的单语提示进行触发识别,然后通过多语提示生成联合事件表示,以解决多义词混淆问题。

Hierarchical prototype

分层原型

Quadruplet contrastive learning

四元对比

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值