知识图谱嵌入(KGE):方法和应用的综述
1. 知识图谱(KG)
- 由实体(节点)和关系(不同类型的边)组成的多关系图。
- 每条边都表示为形式(头实体、关系、尾实体)的三个部分,也称为事实
1.1 问题
- 这类三元组的底层符号特性通常使KGs很难操作
1.2 解决:
- 提出了一种新的研究方向——知识图谱嵌入。
1.3 关键思想
- 嵌入KG的组件,包括将实体和关系转化为连续的向量空间,从而简化操作,同时保留KG的原有的结构。
2. 融合事实信息
2.1 平移距离模型
- 平移距离模型利用了基于距离的评分函数,通过两个实体之间的距离对事实的合理性进行度量。
2.1.1 TransE模型
- 平移不变现象
-
**TransE模型:**将知识库中的关系看作实体间的某种平移向量。
-
对于每个事实三元组(h,r,t),TransE模型将实体和关系表示为同一空间中,把关系向量r看作为头实体向量h和尾实体向量t之间的平移即 h + r ≈ t h+r≈t h+r≈t。
-
可以将r,看作从h到t的翻译
-
知识库中的实体关系类型可分为 一对一 、一对多 、 多对一 、多对多4 种类型,而复杂关系主要指的是 一对多 、 多对一 、多对多的 3 种关系类型。
优点
- TransE模型的参数较少,计算的复杂度显著降低,并且在大规模稀疏知识库上也同样具有较好的性能与可扩展性。
缺点
- TransE模型不能用在处理复杂关系上。
2.1.2 TransH模型
- 为了解决TransE模型在处理一对多 、 多对一 、多对多复杂关系时的局限性。
- TransH模型提出让一个实体在不同的关系下拥有不同的表示。
- 对于关系r,TransH模型同时使用平移向量r和超平面的法向量w_r来表示它。对于一个三元组(h, r, t) , TransH首先将头实体向量h和尾实体向量r,沿法线wr,影到关系r对应的超平面上,用h⊥和t⊥表示如下:
-
TransH 使不同的实体在不同的关系下拥有了不同的表示形式,但由于实体向量被投影到了关系的语义空间中,故它们具有相同的维度
缺点:
- 虽然TransH模型使每个实体在不同关系下拥有了不同的表示,它仍然假设实体和关系处于相同的语义空间中,这一定程度上限制了TransH的表示能力。
2.1.3 TransR模型
- TransR模型认为,一个实体是多种属性的综合体,不同关系关注实体的不同属性。
- 不同的关系拥有不同的语义空间。
- 对于每一个关系r,TransR定义投影矩阵Mr,将实体向量从实体空间投影到关系r的子空间,用h⊥和t⊥表示如下: