基于DGCNN和概率图的轻量级信息抽取模型

本文介绍了如何基于DGCNN和概率图思想解决信息抽取中的SPO三元组抽取消难题。通过半指针-半标注结构,先预测S,再预测S对应的O及P,简化了传统seq2seq模型的步骤。模型结构采用CNN+Attention,结合了DGCNN的编码能力与Self Attention的并行计算优势,有效应对多个S、O、P的情况,避免了使用Bert等慢速模型,实现了轻量级高效的信息抽取解决方案。
摘要由CSDN通过智能技术生成

要解决的问题

抽取出SPO三元组
在这里插入图片描述
难点:
1、如何确定S/O
2、SPO的关系不固定

  • 多个S,1个(P,O)
  • 1个S,多个(P,O)
  • 1个(S,O),多个P

怎么解决

解决的思路:

来源于,seq2seq的概率图思路
在这里插入图片描述

先预测s,然后传入s来预测该s对应的o,然后传入s、o来预测所传入的s、o的关系p,实际应用中,我们还可以把o、p的预测合并为一步,所以总的步骤只需要两步:先预测s,然后传入s来预测该s所对应的o及p。
>P(s,p,o)=P(s)P(o|s)P(p|s,o)

理论上,上述模型只能抽取单一一个三元组,而为了处理可能由多个s、多个o甚至多个p的情况,我们全部使用“半指针-半标注”结构,并且在关系分类的时候也使用sigmoid而不是softmax激活。

如何

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值