笔记:Distant Supervision for Relation Extraction with Sentence-Level Attention and Entity Descriptions

使用句子级注意力机制结合实体描述的远程监督关系抽取

主要内容:本文提出了基于句子级别的注意力机制去选择有效的实例(与Lin 2016类似),进而充分利用监督语料的信息,并且结合实体描述信息来丰富实例的背景知识。实验结果显示本论文优于所有的基线系统。

一、介绍

远程监督是自动标注训练数据的一个有效方法,但其易出现错误的标注数据问题。

  1. Mintz(2009)利用所有的标注实例去训练分类器
  2. Riedel(2010)提出使用至少一个实例的假说,并结合无向图模型进行预测
  3. Hoffmann(2011)使用概率图模型选择实例(基于多实例学习)并且增加重叠关系到关系抽取系统中
  4. Zeng(2015)结合多实例学习(MIL)和PCNN来选择最有效的一个实例进行关系预测,且取得当前最好的结果
以方法取得较好的性能,但是仍存在两个缺点:
  • 一个包里可能含有多个有效的实例(只取一个会丢失大量的有效信息)

  • 对于实例中的实体,若无一个说明,则不确定其表达的是哪个含义(eg:Washington可能表达人名,也可能是地名)
    因此,提出本文的创新点:

  • 使用APCNNs模型----先使用PCNNs抽取出句子的特征向量,再通过隐含层计算每个句子的权重,最后求解特征向量的加权和就是提出的实例特征

  • 添加实体描述信息----使用传统CNN从Freebase或Wikipedia中抽取实体特征

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值