论文浅尝 | 利用开放域触发器知识改进事件检测

笔记整理 | 申时荣,东南大学博士


来源:ACL 2020

源码:https://github.com/shuaiwa16/ekd.git

摘要

事件检测(ED)是文本自动结构化处理的一项基本任务。由于训练数据的规模小,以前的方法在unseen/标记稀疏的触发词上效果较差,并且容易过度拟合密集标记的触发词。为了解决该问题,我们提出了一种新颖的扩展知识提炼(EKD)模型,以利用外部开放域触发知识来减少对注释中频繁触发词的内在偏见。在基准ACE2005上进行的实验表明,我们的模型优于9个强基准,对于unseen/标记稀疏的触发词特别有效。

介绍

事件检测(ED)的核心就是识别触发词,触发词识别是一项艰巨的任务,存在长尾问题。以基准ACE2005为例:频率小于5的触发词占总数的78.2%。长尾问题使监督方法容易过度拟合并且在看不见/稀疏标记的触发器上表现不佳。自动生成更多训练实例似乎是一种解决方案:通过自举扩展更多实例并从远程监督方法中扩展更多数据。但是,如表1所示,这

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值