大模型论文浅尝 | 通过复杂逻辑假设生成推进知识图谱中的溯因推理（ACL2024）

最新推荐文章于 2024-10-18 11:21:51 发布

AI女王

最新推荐文章于 2024-10-18 11:21:51 发布

阅读量1.8k

点赞数 45

文章标签：知识图谱人工智能 AI大模型大模型 LLM AI 学习

本文链接：https://blog.csdn.net/m0_56255097/article/details/142467002

版权

笔记整理：杜超超，天津大学硕士，研究方向为自然语言处理、大语言模型

论文链接：https://aclanthology.org/2024.acl-long.72.pdf

发表会议：ACL2024

1. 动机

溯因推理是做出有根据的猜测，为观察结果提供解释的过程。虽然知识的应用已经很广泛，但是溯因推理与结构化知识（比如，知识图谱）的结合还没有被充分探索。本文的目标是生成一个复杂的逻辑假设，以此来解释一组观察结果，比如，“如果A和C都发生，并且D没有发生，那么B就会发生”。考虑图1的例子，一个逻辑假设(Hypotheses)可以为观察结果(Observations)提供一段合理的解释(Interpretations)。

图1 观察结果和推断逻辑假设的例子

处理这种推断任务的一种直接的方法就是基于搜索的技术，基于观察到的结果探索潜在的假设。但是这种方法面临两个挑战，

首先，知识图谱中的信息可能不完整。基于搜索的方法严重依赖于数据的完整性，知识图谱边的缺失会对这种方法产生消极影响。

其次，逻辑结构假设的复杂性。当处理候选假设的组合时，基于搜索的方法的搜索空间呈指数增长。

为了克服上述挑战，本文提出在监督学习框架内利用生成模型为给定的观测值生成逻辑假设，并使用教师强制(Teacher-forcing)方法训练基于Transformer的生成模型。经过有监督训练的生成模型可以生成在结构上更符合参考假设的逻辑假设，但是对于未知数据，不能保证模型的性能。因此，本文引入了基于知识图谱的强化学习方法（RLF-KG），使得模型在生成假设时，会根据知识图谱中的信息，调整生成的假设，使得这些假设推导出的结论与实际观察到的结果更加一致，它利用近端策略优化(PPO)来最小化观察到的证据与从生成的假设中得出的结论之间的差异。

2. 贡献

本文的主要贡献有：

（1）介绍了复杂逻辑假设生成任务，这项任务可以被视为与知识图谱进行溯因推理的一种形式。

（2）为了应对知识图谱的不完整性和逻辑假设的复杂性带来的挑战，本文提出了一种生成式方法，提高了生成的假设的质量。

（3）开发了基于知识图谱的强化学习(RLF-KG)技术，最大限度地减少观察结果与所生成假设结论之间的差异。

3. 方法

3.1 问题定义

定义一个知识图谱G=(V,R)，V是顶点的集合，R是关系类型的集合，每一个关系类型r∈R都是一个函数：V×V→{true，false}，r(u,v)=true表示在图谱中存在从顶点u到顶点v的类型r，反之为false。对于图谱中缺失的边，用unknown代替，而不是false。推理模型只能访问观察到的图谱G，而真实的图谱被隐藏，并且包含观察到的图谱G。

一个观察(observation)是V中实体的集合O，一个图谱中的逻辑假设H(hypothesis)被定义为一阶逻辑形式的变量顶点V的谓词，AND，OR，NOT。假设可以被写为联合范式：

表示假设是基于给定的图谱G制定的，这意味着假设中的所有实体和关系都必须在G中，可变顶点的域是G的实体集。

H的结论(conclusion)被表示为，是H在G上为true的一组实体：

设O= { }表示一个观察，G是观察到的图谱，是隐藏的图谱，溯因推理的目标就是在G上找到假设H，其在隐藏图上的结论与O最相似，在形式上，使用Jaccard指数对相似性进行量化：

3.2 方法

第一步，从观察到的训练知识图谱中随机抽样假设，首先随机选择一个假设，然后对训练图进行搜索以得出结论，然后将其视为与假设对应的观察结果。将假设和观察结果转换为序列，以输入给生成模型。对于观察，标准化每个元素的顺序，确保同一观测集合的排列产生相同的输出。观察中的每个实体都表示为一个唯一的分词，比如(Apple)和(Phone)，并关联到一个嵌入表示。