简要总结一篇关于知识图谱嵌入的综述

最新推荐文章于 2025-04-08 15:19:09 发布

xhsun1997

最新推荐文章于 2025-04-08 15:19:09 发布

阅读量1.4k

点赞数

分类专栏： KGQA 文章标签：知识图谱人工智能机器学习

本文链接：https://blog.csdn.net/m0_45478865/article/details/121304792

版权

KGQA 专栏收录该内容

5 篇文章

订阅专栏

本文介绍了知识图谱补全的重要性，特别是对于链接预测任务。通过词向量的例子展示了词嵌入如何表达词汇间的相似关系，进而引出TransE模型。TransE利用向量距离来建模实体和关系，用于知识图谱的链接预测。损失函数确保了事实三元组的得分高于非事实三元组，以实现知识图谱的补全。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

综述链接

引言

回顾word2vec，一个典型的例子：
$v_{king}-v_{man}\approx v_{queen}-v_{woman}$
需要知道的是，king和man之间的关系是皇室(royal)，queen和woman之间的关系也是royal。
可以看出，从大规模语料中学习得到的词向量可以建模单词之间的相似关系，这种关系体现在词嵌入空间中的翻译(translations)。

同样的，国家和城市之间也存在这种相似的关系。如：
$v_{Japan}-v_{Tokyo}\approx v_{Germany}-v_{Berlin} \\ v_{German}-v_{Berlin}\approx v_{China}-v_{Beijing}$

我们将上述的国家名、城市名看作实体，而不仅仅是单词。上述公式如果成立，那么可以认为在嵌入空间中，国家实体的向量和首都城市的向量之间存在一种操作，或者说存在一种相似关系，这个相似关系用一个国家的向量减去这个国家的首都的向量来表达，也就是is_capital_of关系（用大白话说：国家a的向量-国家a的首都城市的向量==国家b的向量-国家b的首都城市的向量，所以国家和首都城市之间存在一种相似关系）。因此我们有：
$v_{Tokyo}+v_{is\_captial\_of}-v_{Japan}\approx 0$
这就是TransE模型的启发。

知识图谱的主要问题就是缺失实体和关系，尤其是开放域知识图谱，对一些应用任务（如问答）就会造成负面影响，因为KGQA就是根据用户问题中的实体和关系从KG中查找满足当前实体和关系的实体（也就是说找到某个实体与用户问题的实体和关系构成事实三元组）。

知识图谱补全，也称为链接预测，即预测一个不在KG中的三元组是否是事实三元组，或者给定头实体和关系，从KG中找出尾实体，构成事实三元组。可以看出链接预测任务可以增加KG中triplet的数量，达到补全KG的目的。

有很多方法可以做链接预测，基于嵌入的方法已经被证实是非常有效且效果最好的方法。

符号说明

符号	说明
$\mathcal{E}$	所有实体的集合
$\mathcal{R}$	所有关系的集合
$(h, r, t)$	$(h,r,t)\in \mathcal{E}\times\mathcal{R}\times\mathcal{E}$
$\mathcal{G}$	所有三元组的集合，也就是知识图谱
$f (h, r, t)$	得分函数，定义一个事实三元组的得分
$G_{(h',r,t')}'=\{(h',r,t)\\|h'\in E\cup(h,r,t')\\|t'\in E\}$	要么取代头实体，要么取代尾实体构成负例三元组。不是同时取代头尾实体

嵌入模型

嵌入模型的目的就是学习得分函数，使得正例（事实）三元组的得分一定要大于负例三元组的得分

比如TransE中的得分函数定义为：
$f(h,r,t)=-||v_h+v_r-v_t||$
其中 $||\cdot||$ 表示向量的范数，两个向量差的范数代表着两个向量的距离。
记住：得分函数必须使得正例（事实）三元组的得分一定要大于负例三元组的得分。因此一定要有：
$f(Tokyo,is\_capatial\_of,Japan)>f(Tokyo,is\_captial\_of,German)$
即：
$v_{Tokyo}+v_{is\_captial\_of}-v_{Japan}||>-||v_{Tokyo}+v_{is\_captial\_of}-v_{German}||$

所以有：
$v_{Tokyo}+v_{is\_captial\_of}-v_{Japan}||<||v_{Tokyo}+v_{is\_captial\_of}-v_{German}||$

即 $v_{Tokyo}+v_{is\_captial\_of}$ 与 $v_{Japan}$ 的距离要小于与 $v_{German}$ 的距离。

$f (h, r, t)$ 是得分函数，TransE的损失函数如下：
$L=\max(0,\gamma-f(h,r,t)+f(h',r,t'))$
也就是说：正例三元组的得分一定要比负例三元组的得分大 $\gamma$ 。如果正例三元组的得分-负例三元组的得分< $\gamma$ ，那么就有：
$\gamma-f(h,r,t)+f(h',r,t')>0$
此时loss>0，就会降低loss，也就是提升 $f (h, r, t)$ ，减小 $f (h^{'}, r, t^{'})$ 。

上述的损失函数叫hinge-margin损失。也可以采用常用的负对数似然函数作为损失函数：

$L=-\sum_{(h,r,t)\in\mathcal{G}}(\frac{\exp(f(h,r,t))}{\sum_{t'\in \mathcal{E}\{-t\}}\exp(f(h,r,t'))}+\frac{\exp(f(h,r,t))}{\sum_{h'\in \mathcal{E}\{-h\}}\exp(f(h',r,t))})$
公式看着复杂，其实很简单，比如：传入给模型的是head和relation的embedding，都是长度为d的vector，经过模型后（不是TransE模型，比如DistMult模型，该模型的做法就是将将head和relation的embedding直接elementwise相乘）得到长度为d的vector，再将这个vector与KG中的每一个实体做内积然后softmax得到的就是上述公式中
$\frac{\exp(f(h,r,t))}{\sum_{t'\in \mathcal{E}\{-t\}}\exp(f(h,r,t'))}$
这一部分。

未完待续。