论文笔记 EMNLP 2020|Event Extraction as Multi-turn Question Answering

124 篇文章 14 订阅

1 简介

论文题目:Event Extraction as Multi-turn Question Answering
论文来源:EMNLP 2020 Findings
论文链接:https://aclanthology.org/2020.findings-emnlp.73.pdf

1.1 动机

将事件抽取定义为分类问题,存在下面两个问题:

  1. 无法对标签中的语义进行建模,也无法捕获它们之间丰富的交互信息。
  2. 泛化能力低,不能生成新的事件类型或者论元角色。

1.2 创新

  • 提出一个多轮的问答框架用于事件抽取,可以充分利用触发词、事件类型和论元之间的交互信息,同时多轮的策略可以捕捉相同事件类型中不同论元角色之间的依赖。
    在这里插入图片描述

2 背景知识

将序列定义为C =[<CLS>;Q;<SEP>;P; <SEP>](Q为问题,P为文本),然后经过BERT编码,本篇论文使用两种类型的机器阅读理解(MRC)任务:

  1. 抽取式(答案为文本中的连续span),由于一个句子可能包含多个触发词或者论元,因此对每个token进行BIO标注,进行3分类预测每个token的标签,公式如下:( O i O_i Oi为BERT的输出)
    在这里插入图片描述2. yes/no式(答案为yes或者no),使用BERT中[CLS]的输出,进行二分类。
    在这里插入图片描述

3 方法

在这里插入图片描述
模型的整体框架如上图,主要分为3部分:

  1. 触发词识别:将问题定义为Which word is the trigger word? 使用抽取式MRC抽取出触发词。
  2. 触发词分类:将问题定义为The trigger word is <trigger> <trigger position>, <event type>, <argument roles>?(分别为触发词、触发词在文本中的位置、事件类型、该事件类型全部的论元角色)使用yes/no式回答是否该触发词为此事件类型。
  3. 论元抽取:将问题定义为 <trigger><trigger position>.<event type>,<argument role>? ,将论元抽取定义为多轮的问答,使用抽取式MRC抽取出论元。为了建模同一个事件中不同论元角色之间的依赖关系,对每一个token使用一个历史答案编码,表示该token是否出现在以前的答案中。

4 实验

实验数据集为ACE 2005,实验结果如下图:
在这里插入图片描述
消融实验结果如下图(QAEE为单轮问答,独立抽取论元、rnd表示抽取论元角色的顺序随机、tri表示在论元抽取中移除了触发词和触发词位置信息),可以发现MQAEE效果最好(论元角色顺序为QAEE在验证集中的分类准确率顺序)。
在这里插入图片描述
轮数的影响:
在这里插入图片描述
case study:
在这里插入图片描述
模型在13-way 1-shot和13-way 5-shot情况下的泛化能力:
在这里插入图片描述

5 总结

通过问题模板建模标签之间的交互信息,在论元抽取中通过多轮问答的方式建模论元之间的交互信息。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hlee-top

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值