用图网络做知识图谱实体对齐

本文是对Cross-lingual Knowledge Graph Alignment via Graph Convolutional Networks的深度解读。

使用GNN做实体对齐的先锋

多语言知识图谱(KG)包含多种语言的结构化知识,是跨语言NLP应用的有用资源,跨语言KG的实体对齐是将实体与它在其他语言的对应实体进行匹配的过程,在多语言知识图谱中丰富跨语言链接的一个重要途径。本文提出一个新的利用GCN进行跨语言实体对齐的方法。在给定种子实体对的前提下,训练一个GCN,将每种语言的实体和关系嵌入到一个统一的空间中,,然后基于实体向量的相似度寻找对齐的实体。属性和结构都学习一个表示,最后基于这两种表示进行实体对齐。

0前言

知识图谱以机器可读的形式表示人类知识,已经成为多个AI和NLP任务的重要基础。跨语言实体对齐多语言知识图谱连接多余语言的鸿沟中起重要作用,但是在很多KG中,已经对齐的实体只占一小部分。所以要通过实体对齐对齐更多的实体。

现有的基于嵌入的实体对齐方法都是在一个优化问题中联合地建模跨语言知识和单语言知识,这两种知识的损失必须互相调整。还有一点,现有的方法虽然使用了属性,但都未使用属性值。

基于以上的考虑,本文提出一个新的基于嵌入的KG对齐方法,它使用GCN直接建模实体间的等价关系。GCN是能直接在图上操作的卷积网络,它通过编码节点的邻居信息生成节点的嵌入。在KG中,两个等价实体的邻接实体中往往包含其他等价的实体,本文利用GCN生成邻居自适应的实体嵌入,基于此来发现对齐的实体。本文的方法还同时考虑了实体的属性值。

1问题描述

KG用三元组表示现实世界的知识,这里考虑两类知识:关系三元组和属性三元组,关系三元组表示实体间的关系,属性三元组描述实体的属性。将一个KG表示为G=(E,R,A,T_{R},T_{A}),其中E,R,A分别是实体、关系、属性的集合。T_{R} \subset E\times R\times E是关系三元组的集合,T_{A} \subset E\times A\times V是属性三元组的集合。令G_{1}=(E_{1},R_{1},A_{1},T^{1}_{R},T^{1}_{A})G_{2}=(E_{2},R_{2},A_{2},T^{2}_{R},T^{2}_{A})是两个知识图谱,且S=\{(e_{i1},e_{i2})|e_{i1}\in E_{1},e_{i2}\in E_{2}\}种子实体的集合。我们将跨语言实体对齐任务定义为基于现有的对齐数据寻找新的对齐数据的任务。在很多多语言KG中,不同语言实体间的连接可以看做种子,基于这些种子可找到更多的对齐。

3主要方法

方法的框架如图1所示

给定两个知识图谱G_{1}G_{2},和一组预先对齐的实体S=\{(e_{i1},e_{i2})\}^{m}_{i=1},本文的方法基于GCN的实体嵌入找到新的对齐。方法的基本思想是利用GCN将来自于不同语言的实体嵌入到一个统一的向量空间中,同时希望对齐的实体间距离更近。

GCN是一类直接在图上进行操作的神经网络。它的输入是节点的特征向量和图的结构,目的是输出节点级的实体嵌入。GCN将节点的邻居信息编码为实值向量。在实体对齐问题上,假设:1)等价的实体往往具有相似的关系,2)等价的实体往往具有等价的邻居。GCN可以结合属性信息和结构信息。

一个GCN模型包含多个GCN层。第 l 层的输入是一个顶点特征矩阵H^{(l)}\in \mathbb{R}\times d^{(l)},其中n是节点的数量,d^{(l)是第 l 层的特征数,第 l 层的输出是新的特征矩阵:

H^{(l+1)}=\sigma (\widehat{D}^{-\frac{1}{2}}\widehat{A}\widehat{D}^{-\frac{1}{2}}H^{(l)}W^{(l)})

其中\sigma是激活函数,A是n\times n的邻接矩阵,表示图的结构信,\widehat{A}=A+I,其中I是单位矩阵。\widehat{D}\widehat{A}的对角节点度矩阵,W^{(l)}\in \mathbb{R}^{d^{(l)}\times d^{(l+1)}}是两层间的权值矩阵。d^{(l+1)}是新的一层的维度。

为了同时利用实体的结构和属性信息,在GCN的每一层中为实体设置两个向量:结构向量h_{s}和属性向量h_{a}.在输入层中,h_{s}^{(0)}是随机初始化的,h_{a}^{(0)}是实体的属性向量。令H_{s}H_{a}是所有实体的结构矩阵和属性矩阵,将卷积操作重新定义为:

[H_{s}^{(l+1)};H_{a}^{(l+1)}]=\sigma (\widehat{D}^{-\frac{1}{2}}\widehat{A}\widehat{D}^{-\frac{1}{2}}[H^{(l)}_{s}W_{s}^{(l)};H^{(l)_{a}}W^{(l)}_{a}])

其中W^{(l)}_{s}W^{(l)}_{a}是结构和属性对应的权值矩阵,[;]是矩阵的连接操作,激活函数是ReLU.

下面是模型的详细描述:

模型使用了两个两层的GCN,每个GCN处理一个KG,令GCN_{1},GCN_{2}分别处理KG1和KG2。对于实体的结构特征向量,将向量的维度都设置为d_{s},且两个GCN共享结构特征的权值矩阵W^{(1)}_{s}W^{(2)}_{s};对于属性嵌入,令输出特征向量的维度为d_{a}.由于两个KG中属性的数量可能不同,所以两个KG的输入属性特征向量的维度可能不同。每个GCN的第一层将输入的属性特征映射为维度为d_{a}的特征向量,两个模型输出的属性向量的维度相同。两个GCN的输出都是关于实体的(d_{s}+d_{a})维的嵌入,这个嵌入用于后续的实体对齐。下表列举了两个网络的参数信息。

邻接矩阵的计算:

在GCN中,连接矩阵定义了卷积计算中实体的邻居。对于一个无向图来说,可以直接使用邻接矩阵,但是KG是多关系的有向图,实体被带有类型的关系所连接。所以这里设计了计算连接矩阵的特殊方法:令a_{ij}\in A表示从第 i 个实体传向第 j 个实体的对齐信息。两个实体等价的概率 很大程度上取决于它们与对齐的实体间存在的关系,所以为每个关系计算两个度量值:functionality 和inverse functionality:

fun(r)=\frac{\#Head\_Entiites\_of\_r}{\#Triples\_of\_r}

ifun(r)=\frac{\#Tail\_Entiites\_of\_r}{\#Triples\_of\_r}

为了计算实体 i 对实体 j 的影响,令

a_{ij}=\sum_{<e_{i},r,e_{j}>\in G}{ifun(r)}+\sum_{<e_{j},r,e_{i}>\in G}{fun(r)}

对齐预测:

实体对齐基于实体间的距离进行预测,对于实体e_{1}\in G_{1}e_{2}\in G_{2},它们之间的距离计算方法如下;

D(e_{i},e_{j})=\beta \frac{f(\mathbf{h_{s}}(e_{i}),\mathbf{h_{s}}(e_{j}))}{d_{s}}+(1-\beta) \frac{f(\mathbf{h_{a}}(e_{i}),\mathbf{h_{a}}(e_{j}))}{d_{a}}

其中f({\mathbf{x,y}})=\left \| \mathbf{x-y} \right \|_{1},\beta是平衡两类嵌入重要性的超参数。

我们希望等价实体间的距离很小而不等价实体间的距离很大。对于特定的实体e_{1}\in G_{1},计算其与G2中所有实体的距离并返回一个实体的列表做为候选对齐。这里同时计算了两个方向的对齐。

模型训练:

模型通过最小化下面基于margin的损失函数来训练:

L_{s}=\sum_{(e_{1},e_{2})\in S} \sum _{(e_{1}^{'},e_{2}^{'})\in S^{'}_{(e_{1},e_{2})}}[f(\mathbf{h_{s}}(e_{1}),\mathbf{h_{s}}(e_{2}))+\gamma _{s}-f(\mathbf{h_{s}}(e_{1}^{'}),\mathbf{h_{s}}(e_{2}^{'}))]_{+}

L_{s}=\sum_{(e_{1},e_{2})\in S} \sum _{(e_{1}^{'},e_{2}^{'})\in S^{'}_{(e_{1},e_{2})}}[f(\mathbf{h_{a}}(e_{1}),\mathbf{h_{a}}(e_{2}))+\gamma _{a}-f(\mathbf{h_{a}}(e_{1}^{'}),\mathbf{h_{a}}(e_{2}^{'}))]_{+}

其中[x]_{+}=max\{0,x\},S_{(e_{1},e_{2})}^{'}是由(e_{1},e_{2})通过随机替换一个实体得到的负对齐对。\gamma_{r},\gamma _{a}>0是区分正对齐对和负对齐对的间隔。两种损失分开优化。最后基于两种embedding计算实体的距离

 

 

  • 4
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
随着知识图谱的发展,实体对齐(Entity Alignment)成为了知识图谱领域中的一个重要任务。实体对齐旨在将不同知识图谱中的相应实体进行匹配,从而实现知识图谱的整合和共享。近年来,神经网络(Graph Neural Network,GNN)在实体对齐任务中得到了广泛应用。 目前,基于GNN的实体对齐模型可以分为以下几类: 1. 基于匹配的模型:这类模型将两个知识图谱视为两个,通过计算之间的相似度来进行实体对齐。常用的匹配算法包括子同构匹配、谱聚类等。 2. 基于嵌入的模型:这类模型将知识图谱中的实体和关系映射到低维向量空间中,从而实现实体对齐。常用的嵌入算法包括DeepWalk、Node2Vec、LINE等。 3. 基于注意力机制的模型:这类模型通过引入注意力机制,对知识图谱中的实体进行加权,从而提高实体对齐的准确性。常用的注意力机制包括GAT、Gated-GCN等。 4. 基于卷积网络的模型:这类模型将知识图谱中的实体和关系视为结构,通过多层卷积操作,从局部信息和全局信息两个方面对实体进行表示学习,从而实现实体对齐。常用的卷积网络模型包括GCN、GraphSAGE、GAT等。 总之,基于GNN的实体对齐模型在知识图谱领域中具有广泛的应用前景。随着研究的深入,相信这些模型可以在实体对齐任务中发挥更加重要的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值