论文浅尝 | Beta规则的双向约束辅助文档级关系抽取

dc749640a9443fc94611ecb269b92817.png

笔记整理:刘一春,天津大学硕士,研究方向为规则学习、自然语言处理

链接:https://aclanthology.org/2023.emnlp-main.138.pdf

1、动机

文档级关系提取(DocRE)旨在提取文档中实体对之间的关系。一些工作将逻辑约束引入到DocRE中,解决了原始DocRE模型中不透明和逻辑性弱的问题。然而,它们只关注正向逻辑约束,同时这些工作中挖掘的规则经常受到置信度高但支持度低的伪规则影响。在本文中,我们提出了 Beta 规则双向约束(BCBR),一种新颖的逻辑约束框架。BCBR 首先引入了一个新的规则挖掘器,它通过 Beta 分布对规则进行建模。然后根据Beta规则构建正向和逆向逻辑约束。最后,BCBR通过双向约束重构规则一致性损失来调节DocRE模型的输出。实验表明,BCBR 在关系抽取性能方面与逻辑一致性方面优于原始 DocRE 模型(2.7 F1分数与3.1 逻辑分数)。此外,BCBR 始终优于其他两个逻辑约束框架。

94846ddd8141cff2c460479d56ec947d.png

图1. 逻辑规则约束文档级关系抽取示例

2、亮点

BCBR的亮点主要包括:

  • 据我们所知,本文是第一个提出利用 Beta分布建模规则学习的工作。

  • 本文引入了逆向逻辑约束来确保 DocRE 模型的输出满足规则的必要性。

  • 本文将双向逻辑约束建模为合理的概率模式并将其转变为规则一致性损失。

  • 实验表明 BCBR在关系抽取性能和逻辑一致性上都优于LogiRE和MILR。

3、概念及模型

3adec0be8a268e32969e1852a019ca89.png

(1)Beta规则抽取

知识图谱的规则挖掘方法主要基于知识图谱大规模、数据密集的本质。然而,当这些方法转移到文档数据时,它们仍然依赖于置信度来过滤规则。这就导致了存在大量标准置信度高但支持度低的伪规则的不适应现象。因此,我们放弃单独使用置信度或支持度的方法,而是使用Beta分布来建模规则。在本节中,我们提出了一种新的规则挖掘方法,称为Beta规则。我们通过每条规则的Beta分数积分来衡量规则的质量。公式如下:

9eb4ffebeb3bcf0a4f90ec9b68ff24ae.png

e6cc3bd96fc2ab2b1bf89bcf7e35067a.png

5c2d9cf18b059343ace4839e56984f78.png

(2)双向规则约束

我们利用上述规则对DocRE任务施加约束。然而,以前的方法仅采用从 rbody 到 rhead 的前向逻辑约束。由于规则体原子的不确定性,他们无法利用从 rhead 到 rbody 的反向逻辑约束。BCBR基于头部覆盖规则对反向逻辑约束进行建模,从而补偿约束条件的损失。

  • 正向规则约束

高标准置信度规则中存在正向逻辑约束。当rbody出现,rhead也同时出现时,则认为满足正向向逻辑约束。 反之,如果没有发生rhead,则认为不满足正向逻辑约束。 它代表了 rbody 对 rhead 的充足性。我们对前向约束的理想形式进行建模如下:

31d25c7dd299a926311da0eb51869a1b.png

  • 逆向规则约束

高头部覆盖规则中存在反向约束。当rhead存在时,如果rbody也存在。它被称为满足逆向约束。相反,如果rbody 不存在,则被视为不满足逆向约束。它代表了rbody对于rhead的必要性。反向约束与正向约束的规则形式不同,因为它从rhead导出rbody。rbody包含多个不确定的体原子,但连接三元组的实体可能不存在。合取规则则要求在构建约束概率模型时考虑每个三元组。 因此,我们将德摩根定律用于原有的规则模式,并得到如下面公式所示的析取规则,该规则指出,如果任何体原子不存在,则rhead不存在。这种形式方便我们对规则建模。我们对逆向向约束的理想形式进行建模如下:

495270caffc9181b28447f9908fc0d52.png

133ceaf125a6fd319b69066f50db98ce.png

fb05656b7a985c46579a91c8fbfc5d81.png

(3)规则一致性损失

除了骨干模型原有的关系分类损失之外,我们还基于beta规则的双向约束构建了规则一致性损失。这个损失与关系分类损失联合训练一起提高关系抽取的逻辑一致性和性能。规则一致性损失源自beta规则的双向约束,由两部分组成:高标准置信度规则产生的正向损失和高头覆盖率产生的逆向损失。 损失函数的公式如下:

709a567cb931392877050b36ac3282ac.png

4、实验

为了证明我们方法的有效性和优势。我们在三个数据集上采取了多个Baseline进行了实验。实验结果如下:

同时我们也在inductive场景下对问答任务进行测试。

1bffa51529341b8e199b38a46f63d66f.png

afc61428c08db06e981fb352b920dfb2.png

7400a878bbe9028d251d58645b519e94.png

为了证明每个模块的有效性,我们做了消融实验,其中BC是逻辑一致性模块,BR是Beta规则抽取器模块。

badca6feab5f01dd0fe026396db29b5c.png

下面是案例学习与以及与大模型的区别,点出了在大模型时代下规则学习的意义。

54aeebf1bb4ed4dc27bb088c08f10fe6.png

5、总结

在本文中,我们提出了一种新颖的逻辑约束框架BCBR,它利用Beta规则的双向逻辑约束来调节DocRE的输出。我们率先提出使用Beta分布对规则进行建模,有效解决了伪规则的问题。然后,我们对反向逻辑约束进行建模,并利用 Beta 规则的双向约束来构造规则一致性损失。通过与关系分类损失联合训练,我们提高了 DocRE 的性能。多个数据集上的实验结果证明 BCBR 优于基线模型和其他逻辑约束框架。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

8028d23c013cb6e23499162016d0f28c.png

点击阅读原文,进入 OpenKG 网站。

  • 5
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值