【关系抽取】A Novel Cascade Binary Tagging Framework for Relational Triple Extraction

A Novel Cascade Binary Tagging Framework for Relational Triple Extraction

2020ACL 吉林大学出品

资源:https://github.com/weizhepei/CasRel

Abatract

作者为了解决三元组重叠(overlap)的情况,提出了新的关系抽取的方法,cascade binary taging framework(CasRel),和传统的关系抽取不同,传统的关系抽取是通过两个实体来抽取(离散的)关系标签,但在这里通过CasRel框架来抽取实体及实体间的关系(这部分后面仔细介绍),最终效果得到了很大的提升。

Introduction

首先作者提出了问题,传统的关系抽取是不能很好的解决三元组重叠,上图:

           从图中可以发现,传统的关系抽取针对Normal类型的数据还是可以的,但是针对EPO和SEO的情况就不怎么行了,首先说下EPO,可以看出同一对实体,在传统的关系抽取下只能抽取出一种关系,比如:要么是Act in 或者 Direct movie的关系,然后说下SEO,按说传统的关系抽取也可以,但是数据分布不均衡,比如有的关系标签很多,有的很少,有的正例很多,有的负利很多,这样导致传统模型不能很好的进行学习。尽管像这样的问题已经有人做了很多研究,但是仍然存在很多的问题,他们都把每个实体对的关系看作离散的,这样导致会导致模型学习很困难,原因有两点:第一点,也是上面所说的,数据分布不均衡,第二点, 针对重叠的标签,如果在训练数据很少的情况下,分类器很难去正确的分类。因此作者提出了CasRel框架,把传统形式的关系分类f(s,o)\rightarrow r(其中s表示subject,o表示object)换成了f_{r}(s)\rightarrow o这种形式的,分别训练不同关系的模型,通过s来预测o,比如:如果Figure1中EPO所示,如果s=Quentin Tarantino,f_{Act in}(Queentin Tarantino)=Django Unchained,那么我们就可以判断Quentin Tarantino 和Django Unchained的关系是Act in的类型。

Related Work

这部分就不多说了。

The CASREL Framework

这里仔细讲下CasRel这个框架,灵感来源于下面这个公式(3):

公式也是一步一步拆解的,该公式表达的是求训练集D中每句话Tj中所含的(s,r,o)的最大似然估计。可以看最终的公式(3),可以看出,p(s\mid x_{j})表示在x_{j}话中,s存在的概率,即:在第j个句子中预测s。p_{r}(o\mid s,x_{j})表示在x_{j}和s条件下,o出现的概率,即:在j个句子中,已经知道s的情况下,去预测o。因此整个方案:首先去找到所有的主客体s,然后根据模型找副客体o,找到就可以直接知道实体及关系了,而且这个binary tagging 方案可以一次抽取多个三元组出来。主要模型图如下图2所示:

在这里说下,为啥叫级联(cascade),因为你可以看成两个层级,第一层就是bert输入到subject输出,第二层就是bert输出的中间层(紫色)到object的输出,在这里注意下,这里有多少个关系就有多少个起始位置信息。模型比较简单,在这里就不再多说了,那么这篇论文也就到这吧,如果有什么说的不对的,欢迎指出!拜拜!

 

  • 20
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值