核心问题:
现有方法专注于独立处理三元组中的实体和关系,无法捕获三元组周围局部邻域内固有的隐藏的复杂信息, 文章提出了一种既能封装实体特征又能封装关系特征的知识图谱补全方法.具体地说,我们通过扩展图注意机制来同时获得实体和关系的潜在表示,构造了一个三级自动编码器
(简单来说,就是构造了一个自动编码器,可以利用三元组的语义信息,来补全知识图谱。例如,利用与KG中的Jada Ko- ren Pinkett-Smith相关的两个三元组,即(Will Smith,妻子,Jada Koren Pinkett-Smith)和(Jada Koren Pinkett-Smith,是Jaden Smith的母亲)来推断相应的三重事实(Will Smith,是Jaden Smith的父亲)的知识。但是文章中并没有以这个例子做详细说明,可解释性差)
具体实现:
GAEAT模型包括两个部分:
(1)一个编码器: 通过扩展图注意力机制,用两层图注意力在给定实体的多跳邻居中同时产生实体和关系特征 (2)一个解码器: DistMult(张量分解模型)利用这些表示提取三元组的内部潜在特征
(DistMult:语义匹配模型,利用基于相似性的评分函数。它们通过匹配实体的潜在语义和向量空间表示中包含的关系来度量事实的可信性,只能处理对称关系,文章中使用这个模型的解释是DisMult强制所有的关系嵌入为对角矩阵,这一致地减少了需要学习的参数空间)