论文笔记 ACL 2020|Improving Event Detection via Open-domain Trigger Knowledge

124 篇文章 14 订阅

1 简介

论文题目:Improving Event Detection via Open-domain Trigger Knowledge
论文来源:ACL 2020
论文链接:https://aclanthology.org/2020.acl-main.522.pdf
代码链接:https://github.com/shuaiwa16/ekd

1.1 动机

  • 由于标记数据的长尾问题(大量的类别仅有少量的样本)和生成数据的同质性,以前的方法在未见过或者稀疏的数据上表现不佳,在密集的数据上过拟合。

1.2 创新

  • 第一个利用开放域的触发词知识提高事件检测的性能。
  • 提出了一个新的teacher-student模型,从标记和未标记的数据中学习,减少标记中的内置偏差。

2 方法

2.1 知识收集

从WordNet中收集开放域触发词知识,分为下面两个步骤:

  1. 消除单词的歧义:使用IMS消岐,然后使用Stanford CoreNLP获得特征(词性标注、句法分析)。
  2. 判断是否触发事件:利用一个查表的方法,判断是否触发事件。

2.2 模型

在这里插入图片描述
模型的整体框架如上图,主要包括下面几部分:

  • 特征抽取:使用BERT对句子进行编码。
  • 事件预测:对于带标注的数据,预测每个词的事件类型。公式如下:
  • 知识蒸馏:知识蒸馏的目标是使teacher模型的概率等于student模型的概率(公式如下),两个模型共享参数,teacher模型的输入为 S + S^+ S+(Knowledge-attending Sentences),通过开放域触发词知识,使用B-TRI和E-TRI标注触发词的开始和结束边界。如原始句子为 S = { w 1 , w 2 , . . . , w i , . . . , w n } S=\{w_1,w_2,...,w_i,...,w_n\} S={w1,w2,...,wi,...,wn}, w i w_i wi为开放域触发词知识定义的触发词, S + = { w 1 , w 2 , . . . , B − T R I , w i , E − T R I , . . . , w n } S^+=\{w_1,w_2,...,B-TRI,w_i,E-TRI,...,w_n\} S+={w1,w2,...,BTRI,wi,ETRI,...,wn}。B-TRI和E-TRI在知识收集的句子上微调(mask的概率为15%)。student模型的输入为 S − S^- S(Knowledge-absent Sentences),随机mask由开放域触发词知识定义的触发词,如 S − = { w 1 , w 2 , . . . , [ M A S K ] , . . . , w n } S^-=\{w_1,w_2,...,[MASK],...,w_n\} S={w1,w2,...,[MASK],...,wn}。使用KL散度最小化概率分布之间的差异,公式如下:
  • 联合训练:优化的目标为带标注数据的监督loss和未标注数据的KL散度loss,公式如下:
    在这里插入图片描述

3 实验

在ACE 2005数据集上的实验结果如下图:
在这里插入图片描述
为了评测是否将知识蒸馏到模型中,在测试集上观察带和不带开放域触发词知识的实验效果,结果如下图:
在这里插入图片描述
在领域迁移情形下的实验结果:
在这里插入图片描述
不同频率触发词的实验结果:
在这里插入图片描述
使用三种不同的知识,验证模型是否可以蒸馏其他的知识类型,实验结果如下图:
在这里插入图片描述
Case Study:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hlee-top

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值