©PaperWeekly 原创 · 作者 | 陈星然、崔万云
单位 | 密歇根大学、上海财经大学
研究方向 | 知识图谱、知识推理
摘要
之前的研究普遍认为,规则推理模型依靠规则中前提和假说的语义一致性。例如 ,的语义与 一致。我们挑战这一观点。我们发现了一类特殊的规则。这类规则表示了不同实例在某一属性上的等价性,而非语义一致性。
令人惊讶的是,尽管这类规则只占据整个规则空间的一小部分,利用它们在 4 个标准知识图谱补全数据集上的推理效果都超过了其它所有规则的效果。这表明,规则推理模型之所以有效,很大程度上是因为该实例等价性,而非语义一致性。这一发现对规则推理模型的工作机制提供了新的洞察。
基于该洞察,我们提出了一种知识图谱补全新方法:基于实例的学习(instance-based learning)。例如,为了回答(Jill Biden, lived city, ? ),我们不直接找到答案实体 Washington D.C.,而是找到原型实体Joe Biden,因为他与 Jill Biden 有相同的 lived city。我们基于翻译模型(translational model)发展了实例等价性的理论,并与原有翻译模型相结合。我们在多个数据集上验证了所提出模型的有效性和可解释性。
本文已被 NeurIPS 2022 接收。
论文标题:
Instance-based Learning for Knowledge Base Completion
论文链接:
https://arxiv.org/abs/2211.06807
代码链接:
https://github.com/chenxran/InstanceBasedLearning
对规则推理的新洞察——实例等价性
2.1 规则推理(rule-based reasoning)的一般认知
基于规则推理的知识图谱补全模型,对现有图谱数据归纳出形如 的规则集合,并进行推理。如下是一些之前文献中提到的典型规则:
RNNLogic [1] 提到的例子:
NeuralLP [2] 提到的例子:
基于这些例子,研究人员普遍认为规则的前提(premise)和假说(hypothesis)具备语义一致性。例如,nationality与路径 的语义是一致的。
2.2 一类特殊规则的发现
我们发现的一类特殊的规则打破了上述认知。我们在下边展示出 FB15k-237 数据集中,对于 profession 关系使用 RNNLogic [1] 归纳出的排名前三的规则。