实体关系抽取学习记录

暑假要开始上手知识图谱的项目了,所以就把之前的那些学习积累做一个简要的梳理,加油,你的所有积累都会在某一天带给你意想不到的惊喜~~

接下来进入正题

关系抽取主要分为三类:
(1)有监督学习:将关系抽取任务当作分类问题,根据训练数据设计有效的特征,从而学习各类分类模型,然后用训练好的分类器预测关系。该方法的问题在于需要大量的人工标注训练语料,而训练语料标注工作通常耗时耗力。
(2)半监督学习方法:该方法主要采用bootstrapping进行关系抽取。对于要抽取的关系,该方法设定若干种子实例,然后迭代的从数据中抽取关系对应的关系模板和更多的实例。
(3)无监督学习方法:假设拥有相同语义关系的实体对拥有相似的上下文信息来代表实体对的语义关系,并对所有实体对的语义关系进行聚类。

但是有监督学习中人工标注数据十分局限,并且还要做实体对齐那么一旦面对巨大的数据量,就显得工作量巨大繁杂。

远程监督就成为大家的宠儿。
远程监督认为知识图谱中可获取三元组R(E1,E2),且E1,E2贡献在句子S中,则S表达了E1,E2间的关系R,标注为训练正例。基本假设过强,所以就会有大量噪声的问题。就是在后面的各种论文中频繁出现的,the wrong label problem,其出现的根本原因是:远程监督假设一个实体对只对应一种关系,但实际上实体间可以同时具备多种关系,实体间也可能不存在某种关系,而仅仅因为涉及了某个话题才在句中共现。

深度学习进行关系抽取目前是比较热门的领域,我看的论文可以分为下面几类:
(一)CNN+attention

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值