8.7+8.8+8.14 知识图谱嵌入技术研究综述-知网-张天成、田雪、孙相会等-软件学报.2023,34(01)-复杂关系建模

文章介绍了TransE在处理复杂关系上的局限,随后详细讨论了TransH、TransR和TransD等模型如何通过在不同空间表示实体和关系来改善知识图谱建模。还提及了基于流形和群的ManifoldE和TorusE模型,以及考虑不确定性的KG2E模型。
摘要由CSDN通过智能技术生成

1  基本符号定义

 (三)复杂关系建模

        TransE 模型在大规模知识图谱上效果明显,但是由于其模型简单,导致 TransE 无法对知识库中的复杂关系建模,这里的复杂关系定义如下。按照知识库中关系两端连接实体的数目,可以将关系划分为 1-1,1-N,N-1 和 N-N 这 4 种类型,例如 1-N 类型关系指的是一个头实体会平均对应多个尾实体。我们将 1-N,N-1 和 N-N 称为复杂关系。研究发现,各种知识获取算法在处理 4 种类型关系时的性能差异较大,例如:TransE 在处理复杂关系建模时性能降低,这与其模型的假设有密切关系。

        例如:事实“比尔·克林顿在 1993 年到 2001 年间担任美国总统”可以被抽象为如下三元组:

                                        (hi : BillClinton,ri : wasPresidentOf,ti : USA)

        将另一个事实“乔治·沃克·布什在 2001 年到 2009 年间担任美国总统”,表述为如下三元组:

                                (hj : GeorgeWalkerBush,rj : wasPresidentOf,tj : USA)

        显然,上述两个三元组共享相同的尾实体与关系,而具有不同的头实体。此时,如果使用 TransE 从以上两个三元组学习知识表示,TransE 会推导出hi=hj的错误结论。为了解决这一问题,近年来涌现了大量关于 TransE 的扩展模型,接下来按照实体与关系的不同表示空间进行划分,介绍其中的代表模型。

        (1) Point-Wise 空间

        Point-Wise 欧氏空间广泛应用于表示实体和关系,在向量或矩阵空间中投影关系嵌入,或者捕捉关系交互。

                                                 

         ● TransH:TransH模型使得一个实体在涉及不同关系时具有分布式表示。如图所示,TransH 将实体建模为向量,将每个关系 r 建模为法向量为Wr的关系特定超平面上的向量。具体来说,对于一个三元组(h,r,t),TransH 首先将头实体向量 h 与尾实体向量沿法线投影到关系 r 对应的超平面上,投影分别记为 ,表示如下:

                                        

        如果三元组 (h,r,t) 成立,即 h⊥+ r ≈ t⊥,假设投影在超平面上由 r 以低误差连接,则 TransH 的评分函数定义为:

                                                

        通过引入投影到关系特定超平面的机制,TransH使得每个实体在不同的关系中具有不同的表示形式。

我的思考-TransH数学推导:

首先,我们假设w为关系平面Wr的单位法向量,在原始的向量h在法向量w上的投影长度为:

                                                                          |W| * |h| * cosθ

整理成向量的形式就是:

                                                                        |W| * |h| * cosθ * W

其中,一定要注意的是W是单位法向量。

也就是说,原始向量h在关系平面Wr上的单位法向量的投影为:

                                 

注:

在数学中,两个向量的内积可以通过将一个向量转置后与另一个向量相乘得到。向量的长度可以通过计算向量的模(即向量的长度)得到。

假设有两个向量,一个是法向量n,另一个是头实体向量h。它们的内积可以表示为n^T * h,其中n^T表示n的转置。

根据向量的内积定义,n^T * h = |n| * |h| * cos(θ),其中|n|表示n的长度,|h|表示h的长度,θ表示n和h之间的夹角。

则,我们可以确定的是对于映射向量hr有:

                 

我们用图来表示就是:

        ● TransR:TransE 和 TransH 模型假定实体和关系嵌入在同一空间2234cd97073f4fe0b58272202323f51d.png中,但是关系和实体是完全不同的对象。一个实体是多种属性的综合体,而各种关系关注实体的不同属性。因此,某些相似的实体在实体空间中彼此接近,而在某些特定属性上不同,在对应的关系空间中应彼此远离。为了解决这个问题,提出了 TransR 方法,该方法在不同的空间 (实体空间和关系空间) 中对实体和关系进行建模,并在关系空间中进行翻译。                  87c4badcc6fc492b98b97639fac61312.png

        TransR 的基本思想如图所示,对于每个三元组(h,r,t),首先将头、尾实体向量向关系 r 空间投影,使得原来在实体空间中与头、尾实体相似的实体在关系 r 空间中被区分开。具体来说,对于每一个关系 r,TransR 设置一个投影矩阵8918f52a5ff0447f94c4d210da8cdb61.png,将实体c356401ea39d4c0d8cabd3be5f9a972a.png从实体空间投影到关系5f9e0eb591574c94b970ad3d89fdd10b.png空间。利用投影矩阵,实体的投影向量定义如下 :

                                                      7e41d02e78ac437ba23f078475d5e491.png

 其中,Mr是从实体空间到 r 的关系空间的投影矩阵。因此,TransR 的评分函数定义为:

                                                   5a2e9c585dc243069111986817c8c86b.png

         ● TransD:虽然 TransR 较 TransE 和 TransH 具有显著的改进,但它仍然存在一些缺陷:① 对于关系 r,头、尾实体共享相同的投影矩阵Mr,忽略了头、尾实体不同的类型和属性;② 投影操作是实体与关系之间的交互过程,因此,投影矩阵仅由关系决定是不合理的;③ 与 TransE 和 TransH 相比,矩阵-向量乘法使 TransR 模型参数急剧增加,因此,TransR 难以应用于大规模知识图谱。

        为此,提出改进模型 TransD,下图显示了其基本思想,每个形状表示出现在关系 r 的三元组中的一个实体对,Mrh 和 Mrt 分别是 h 和 t 的投影矩阵,whi,wti (i = 1,2,3)和 wr 是投影向量。c0d7af5cdea04eb1aa154d4397f8c826.png是实体的投影向量,满足561b0368f0af49ea997de0422afb1d08.png。TransD 为每个实体和关系定义两个向量,一个是实体/关系表示,另一个用于构造投影矩阵。例如,给定三元组(h,r,t),其向量为:6b5803d57a2242318452759afe1c4341.png,TransD 模型进一步学习了 2 个分别将头 实体与尾实体投影到关系空间的投影矩阵37a778a7cd724e23a4a593d0eff70f5b.png,具体定义如下:                                                0b29ce105e0f404fba3e4b4ce9f57f7c.png

 dddae290cc5e4a7c9c13b3e2707ea5d6.png

        显然,这里的投影矩阵Mrh,Mrt 与实体和关系均有关,并且利用两个投影向量构造投影矩阵解决了 TransR 面临的参数众多问题。对于三元组(h,r,t),TransD 的评分函数定义如下:

                                804462f7c8334806a398adbb4e2fe722.png 

◆ STransE

◆ TranSparse

◆ TransM

◆ TransA

◆ TransF

◆ ITransF

◆ TransAt

◆ TransMS

(2)流形和群

        流形是由集合论定义为具有邻域的点的集合的拓扑空间,Point-Wise 建模是一个不适定 (从数学上讲, 不适定的代数系统通常会使解决方案不精确且不稳定) 的代数系统,无法在大规模知识图谱中进行精确的链接预测。为了解决这些问题,Xiao 等人提出了一种基于流形的嵌入原理(ManifoldE),该原理可被看作是一个适定的代数系统,它将 Point-Wise 嵌入扩展为基于流形的嵌入。

        给定三元组(h, r, t),ManifoldE 基于流形的原理,当给定一个头实体和一个关系时,尾实体位于一个高维流形中。ManifoldE 采用三元组远离流形的距离来设计评分函数:

      

 其中,Dr是关系特定的流形参数,MF:是流形函数,其中是实体集,是关系集,是实数字段。

         TransE 模型在计算实体距离之前,对所有的实体和关系向量进行了正则化,这种规范化虽然避免了向量空间的无限扩张,但也导致了新的矛盾。为了避免正则化带来的矛盾,TorusE 模型将映射空间由普通向量空间替换成了李群。在 TransE 的嵌入模型中,向量空间需要满足的条件有: (1) 可微的流形空间,(2) 群运算(+,-)可微且 (3) 能够定义距离函数。TorusE 模型在此基础上增加了空间紧致性的条件,克服了 TransE 的局限性,而且可以证明,紧李群可以满足 TransE 遵循的优化目标和正则化条件。

李群简介:李群是一种只有一个运算的、比较简单的代数结构;是可用来建立许多其他代数系统的一种基本结构。在数学中,李群(Lie group)是具有群结构的实流形或者复流形,并且群中的加法运算和逆元运算是栁形中的解析映射。李群在数学分析、物理和几何中都有非常重要的作用。

李群的概念:拓扑群既是一个群,又是一个拓扑空间,如果更近一步的是一个(微分)流形,那它就被称为李群。

定义1  (实)李群

给定一个实光滑流形 G,若 G 配合二元运算 • 构成一个群,并且以下两个映射都是光滑映射:

1.群运算映射:,其中G × G 是积流形;

2.逆运算映射:

那么我们说 G 是一个实李群,简称李群。 

定义2   紧李群

一个李群被称为紧李群,当且仅当它是一个紧流形。

 (3)高斯空间

        前面提出的部分模型 (例如: TransE) 通过优化全局损失函数来确保 KG 中正三元组分数高于负三元组。然而,这些模型忽略了实体和关系的 (不) 确定性。实际上,不同的实体和关系可能包含不同的确定性,近几年的一些研究考虑了它们的不确定性,并将其建模为随机变量。

◆ KG2E

◆ TransG

 参考:

李群

知识图谱——TransH模型原理

【向量在法向量所垂直的平面上的投影】

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值