AMIE关联规则挖掘

最新推荐文章于 2025-04-06 23:20:30 发布

StandByMe.

最新推荐文章于 2025-04-06 23:20:30 发布

阅读量894

点赞数 3

文章标签：前端 javascript html

本文链接：https://blog.csdn.net/qq_51514930/article/details/140610281

版权

AMIE（Association Rule Mining under Incomplete Evidence）是一个用于从不完全知识图谱中挖掘关联规则的算法。它是为了处理在知识图谱中存在的不完全性和不确定性而设计的，能够发现实体和关系之间的有意义的模式和关联。

AMIE的计算过程可以概述如下：

规则生成：AMIE从知识图谱中生成候选规则。这些规则的形式通常是head←body，其中head和body都是带有变量的三元组。例如，一个规则可能是 Parent(X,Y)←Father(X,Y)。
规则评估：对于每个候选规则，AMIE计算其支持度和置信度。支持度是指满足规则的实例数量，置信度是满足body的实例中满足head的比例。例如，如果规则是 Parent(X,Y)←Father(X,Y)，支持度就是知识图谱中有多少对(X, Y)满足这个规则，置信度则是这些对中有多少同时满足Parent关系。
规则修剪：AMIE通过对支持度和置信度的阈值进行过滤，保留有意义和高置信度的规则。这有助于减少噪声和无意义的规则。
规则扩展：AMIE会通过不断扩展规则的body部分来生成更复杂的规则，并重新计算其支持度和置信度。扩展规则可以帮助发现更深层次的关联。例如，从 Parent(X,Y)←Father(X,Y)扩展到Parent(X,Y)←Father(X,Y)∧Married(X,Z)。
迭代过程：上述步骤会反复进行，直到无法再生成新的有意义的规则为止。

以下是AMIE算法的一些具体步骤和计算公式：

支持度计算：
$\mathrm{Support}(R)=|\{(X,Y)\mid\mathrm{body}(X,Y)\wedge\mathrm{head}(X,Y)\}|$
其中，R是规则，body(X,Y)和 head(X,Y)是规则的body和head部分。
置信度计算：
$\mathrm{Confidence}(R)=\frac{\mathrm{Support}(R)}{|\{(X,Y)\mid\mathrm{body}(X,Y)\}|}$
置信度表示在满足body部分的所有实例中，有多少也满足head部分。
标准置信度（Standard Confidence）：
$\text{Standard Confidence}(R)=\frac{|\{(X,Y)\mid\mathrm{body}(X,Y)\wedge\mathrm{head}(X,Y)\}|}{|\{(X,Y)\mid\mathrm{body}(X,Y)\}|}$
PCA置信度（PCA Confidence）：
$\mathrm{PCA~Confidence}(R)=\frac{|\{(X,Y)\mid\mathrm{body}(X,Y)\land\mathrm{head}(X,Y)\}|}{|\{(X,Y)\mid\mathrm{body}(X,Y)\land\exists Z\mathrm{~head}(X,Z)\}|}$
PCA置信度考虑了知识图谱中可能存在的未观测到的三元组，因此通常比标准置信度更稳健。