知识图谱（二）——知识推理

最新推荐文章于 2025-04-07 09:46:54 发布

sam-X

最新推荐文章于 2025-04-07 09:46:54 发布

阅读量2.5w

点赞数 9

分类专栏：机器学习文章标签：知识图谱知识推理表示学习谓词逻辑

本文链接：https://blog.csdn.net/u010945683/article/details/79961042

版权

机器学习专栏收录该内容

30 篇文章

订阅专栏

知识推理是知识图谱中很重要的一部分，主要用于推理暗含的知识（丰富知识图谱），检查知识库的不一致（知识清洗）

知识推理分类

演绎推理

从一般到特殊的过程.从一般性的前提出发，通过推导，得到具体描述或个别结论（三段论），结论已经蕴含一般性知识中，只是通过演绎推理揭示出来，不能得到新知识.

归纳推理

从特殊到一般的推理过程.从一类事物的大量特殊事例出发，去推出该类事物的一般性结论（数学归纳法），推出的结论没有包含在已有内容中，增加了新知识.

确定性推理&不确定推理

数值推理&符号推理

基于表示学习的推理

归纳推理

归纳逻辑程序设计（Inductive Logic Programming, ILP）使用一阶谓词逻辑来进行知识表示，通过修改和扩充逻辑表达式来完成对数据的归纳

这里写图片描述

FOIL（First Order Inductive Learner）算法

利用序贯覆盖实现规则学习

Algorithm
1. 从空规则开始，将目标谓词作为规则头
2. 逐一将其他谓词加入规则提进行考察，按预定标准评估规则的优劣并选取最优规则
3. 将该规则覆盖的训练样例去除，以剩下的训练样例组成训练集重复上述过程

评估准则

F O I L_G A I N = m^+ * (log 2 m ^ + m ^ + + m ^ - - log 2 m + m + + m -)

$FOIL\_GAIN = \hat m_+*(\log_2{{\hat m_+}\over{\hat m_++\hat m_-}}-\log_2{{m_+}\over{m_++m_-}})$

其中， $\hat m_+/\hat m_-$ 为增加候选文字后新规则覆盖的正反例数目， $m_+/m_-$ 表示原规则所覆盖的曾凡丽数目.（类似于决策树的信息增益）

上述的归纳逻辑程序设计（ILP）具有以下缺点：需要目标谓词的正例和反例，同时暗含封闭世界假设（即所有未声明是正例的样本都是反例）

AMIE算法

不完备知识库的关联规则挖掘（Association Rule Mining under Incomplete Evidence，AMIE）支持从不完备知识库中，挖掘闭式规则

AMIE依次学习预测每种关系的规则。对于每种关系，从规则体为空的规则开始，通过三种操作扩展规则体部分，保留支持度大于阈值的候选（闭式）规则。

添加悬挂边：悬挂边是指边的一端是一个未出现过的变量，而另一端（变量或常量）是在规则中出现过的
添加实例边：实例边与悬挂边类似，边的一端也是在规则中出现过的变量或常量，但另一端是未出现过的常量，也就是知识库中的实体
添加闭合边 ：闭合边则是连接两个已经存在于规则中的元素（变量或常量）的边。

这里写图片描述

评估准则
- 支持度：同时符合规则体和规则头的实例数目

s u p p (B ⃗ \Rightarrow r (x, y)) : = # (x, y) : \exists z 1, . . ., z m : B ⃗ \land r (x, y)

$supp(\vec B \Rightarrow r(x,y)):= \#(x,y):\exists z_1,...,z_m:\vec B \land r(x,y)$
- 置信度：支持度除以仅符合规则体的实例数目

c o n f (B ⃗ \Rightarrow r (x, y)) : = s u p p ( B ⃗ \Rightarrow r ( x , y ) ) # ( x , y ) : \exists z 1 , . . . , z m : B ⃗

$conf(\vec B \Rightarrow r(x,y)):={{supp(\vec B \Rightarrow r(x,y))}\over{\#(x,y):\exists z_1,...,z_m:\vec B}}$
- PCA置信度

p c a c o n f (B ⃗ \Rightarrow r (x, y)) : = s u p p ( B ⃗ \Rightarrow r ( x , y ) ) # ( x , y ) : \exists z 1 , . . . , z m : B ⃗ \land r ( x , y ‘ )

$pcaconf(\vec B \Rightarrow r(x,y)):={{supp(\vec B \Rightarrow r(x,y))}\over{\#(x,y):\exists z_1,...,z_m:\vec B\land r(x,y^`)}}$

路径排序算法

路径排序算法（Path Ranking Algorithm)，PRA），以两个实体间的路径作为特征，来判断它们之间可能存在的关系

Algorithm
1. 特征抽取（生成并选择路径特征集合）
方法：随机游走，广度优先搜索，深度优先搜索
2. 特征计算（计算每个训练样例的特征值）
方法：随机游走概率，布尔值（出现/不出现），出现频次/概率
3. 分类器训练（根据训练样例，为每个目标关系训练一个分类器）
方法：单任务学习（为每个关系单独训练二分类器）；多任务学习（不同关系联合学习）