论元笔记 ICASSP 2022|GENERATING DISENTANGLED ARGUMENTS WITH PROMPTS: A SIMPLE EVENT EXTRACTION FRAMEWORK

125 篇文章 12 订阅

1 简介

论文题目:GENERATING DISENTANGLED ARGUMENTS WITH PROMPTS: A SIMPLE EVENT EXTRACTION FRAMEWORK THAT WORKS
论文来源:ICASSP 2022
组织机构:北京航空航天大学
论文链接:https://arxiv.org/abs/2110.04525
代码链接:https://github.com/RingBDStack/GDAP

1.1 动机

  • 先前基于生成的事件抽取方法专注于在解码期间结合标签语义(作为约束),但未能在编码端充分利用此类信号(事件类型和触发词)。
  • 生成模型假设触发词和参数抽取之间的依赖关系,因此可以串行或联合实现这两个模块,然而在一些例子中触发词对论元抽取是无帮助的(语法和语义方面),甚至一些触发词和论元是重叠的。
    在这里插入图片描述

1.2 创新

  • 提出一个基于prompt的事件抽取方法,将触发词抽取和论元抽取分离开,并行的进行。

2 方法

在这里插入图片描述
模型的整体框架如上图,主要包括事件类型检测、触发词抽取和论元抽取三部分(Encoder-Decoder结构参数不共享)。

2.1 Event Type Detection

事件类型检测输入为原始文本,输出格式为事件类型(如下图),使用(和)分割,使用有限自动机得到事件类型,解码时防止字词字典合并生成的token不属于候选事件类型,使用tire-based约束解码算法。
在这里插入图片描述

2.2 Trigger Extraction

触发词抽取输入为文本和事件类型的拼接,使用< /s>分割(图1),输出为触发词列表(图2),触发词全部来自输入文本,解码与上一阶段一致,使用有限自动机和tire-based约束解码算法。

2.3 Argument Extraction

论元抽取的输入为事件类型、论元角色和文本的拼接(图1),输出为论元列表(图2):

在触发词抽取和论元抽取中,在训练时使用负采样机制,对于每个文本,随机抽取N个该文本中不出现的事件类型进行训练,此时模型应该生成空的序列,为(())

3 实验

实验数据集为ACE 2005,全部baseline不适用gold实体,实验结果如下图:
在这里插入图片描述
消融实验:
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hlee-top

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值