Error detection in Knowledge Graphs: Path Ranking, Embeddings or both?
- 错误的三元组本质上是对象s与对象o(两者均为E)之间的错误边缘,关系r∈R将它们连接在一起。
- PaTyBRED:PRA启发式算法,使用路径作为特征,将路径定义为关系r1→r2→...→rn的序列。
- TransE:给定三元组(s,r,o)是正确的,则主题s和关系r可以与对象o连接,且误差很小,这意味着s + r≈o。递归地最小化使用上述能量函数和负采样进行训练的成对评分函数
- Confidence-aware KRL (CKRL):认知感知的KRL框架,在TransE模型的成对损失函数中注入了三元组置信度C(s,r,o),旨在学习更好的知识表示。
- PTransE:CKRL方法的前身,它使用路径来引导嵌入,其方式与CKRL不同。
- 路径排序引导嵌入(PRGE):混合方法。
PPT
知识图中的错误检测:路径排名,嵌入还是两者?
Problem Formulation
首先,将知识图G定义为一组三元组。 每个三元组都遵循(s,r,o)的形式,其中(s,o)∈E是实体,而r∈R是绑定它们的关系。
假设知识图G也包含一定比例的噪声N%,这表示G中的三元组中有N%是错误的。
这些错误的三元组本质上是对象s与对象o(两者均为E)之间的错误边缘,关系r∈R将它们连接在一起。
因此,论文的目标是找到一种方法来查明G中的这些错误。
Methods Employed
PRA启发式算法,在错误检测的上下文中使用此,
该算法的概念是将这些路径用作确定给定三元组是否为噪声的特征。
PaTyBRED使用路径作为特征,将路径定义为关系r1→r2→...→rn的序列。
如果存在实体x1,x2,...,xn-1,则对象s和对象o可以通过路径P(s,o)连接,使得P(s,o)= r1(s,x1)→ ...→ri(xi-1,xi)→...→rn(xn-1,o)。
修剪路径后,将填充NR功能表,其中NR是关系数。
在使用NR个不同的分类器(每个关系一个)之后,为每个三元组确定一个值[0-1]的置信度分数,而表示噪声的分数较低。
给定三元组(s,r,o)是正确的,则主题s和关系r可以与对象o连接,且误