【自然语言处理】【知识图谱】基于图匹配神经网络的跨语言知识图谱对齐

BQW_

已于 2022-05-22 14:44:47 修改

阅读量1.8k

点赞数

分类专栏：自然语言处理文章标签：知识图谱自然语言处理实体对齐图神经网络 EntityAlignment

于 2021-04-13 21:33:17 首次发布

本文链接：https://blog.csdn.net/bqw18744018044/article/details/115679633

版权

自然语言处理专栏收录该内容

125 篇文章 149 订阅

订阅专栏

本文介绍了基于图匹配神经网络的跨语言知识图谱对齐方法，通过构建topic entity graph来表示实体的上下文，并利用GCN学习实体嵌入。采用注意力匹配和多层GCN进行图级匹配，解决实体对齐中的挑战。这种方法考虑了局部和全局信息，提高了对齐准确性。

摘要由CSDN通过智能技术生成

《基于图匹配神经网络的跨语言知识图谱对齐》 Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

相关博客：
【自然语言处理】【知识图谱】利用属性、值、结构来实现实体对齐
 【自然语言处理】【知识图谱】基于图匹配神经网络的跨语言知识图谱对齐
 【自然语言处理】【知识图谱】使用属性嵌入实现知识图谱间的实体对齐
 【自然语言处理】【知识图谱】用于实体对齐的多视角知识图谱嵌入
 【自然语言处理】【知识图谱】MTransE：用于交叉知识对齐的多语言知识图谱嵌入
 【自然语言处理】【知识图谱】SEU：无监督、非神经网络实体对齐超越有监督图神经网络？

一、简介

知识图谱以结构化的形式表示人类的知识，并成功应用到了许多自然语言处理任务中。但是，知识图谱通常是单语言的。为了能够将不同语言的知识图谱链接起来，交叉语言知识图谱对齐任务被提了出来。

近些年研究者提出了许多实体对齐的方法，这些方法将三元组中的知识编码至低维向量空间中。但是，不同语言知识图谱中的实体，其所属的三元组可能并不相同，这将进一步提高对齐的难度。

在这里插入图片描述

图1中的两个实体 $e_0$ 和 $e'_0$ 为对齐的实体，但是其邻居中仅有一对是对齐的实体，其他均不对齐。由于先前的嵌入方法不能将描述实体的文本信息(例如实体的name)进行编码，而结构又无法提供充分的信息用于对齐。

为了解决上面的问题，论文提出了 $\text{topic entity graph}$ 来表示一个实体的上下文。并且不同于先前使用实体嵌入进行对齐的方法，论文将实体对齐问题转换为 $\text{topic entity graph}$ 的图匹配问题。具体来说，首先利用 $\text{GCN}$ 将两个图 $G_1$ 和 $G_2$ 编码为两个包含实体嵌入向量的列表。然后，通过一个注意力匹配方法将两个图中的实体进行两两匹配。最后，使用生成的两两匹配向量进行分类。

二、Topic Entity Graph

直觉上，知识图谱中实体的局部上下文信息对于实体对齐任务非常的重要。因此，论文提出了 $\text{topic entity graph}$ ，其能够表示给定实体的上下文关系。 $\text{topic entity graph}$ 的构建步骤如下：

收集给定实体的1跳邻居实体，得到实体集合 $\{e_1,\dots,e_n\}$ ；
将集合 $\{e_1,\dots,e_n\}$ 中的实体作为 $\text{topic entity graph}$ 中的节点，若实体对 $e_i,e_j)$ 在原始知识图谱中存在关系 $r$ ，那么在 $\text{topic entity graph}$ 中添加一条连接这两个实体的有向边；
$\text{topic entity graph}$ 中的边并不保留原始边的类型，只保留方向。

三、图匹配方法

本方法会为每对待对齐的实体创建对应的 $\text{topic entity graph}$ ，即 $G_1$ 和 $G_2$ 。

1. 输入表示层

该层的目标是通过 $\text{GCN}$ 来学习出现在 $\text{topic entity graph}$ 中实体的嵌入向量。下面以实体 $v$ 为例子展示嵌入向量的生成过程：

(1) 利用单词级别的 $\text{LSTM}$ 将实体 $v$ 的名称转换为初始特征向量 $\textbf{a}_v$ ；
(2) 根据边的方向，将实体 $v$ 的邻居分类为输入邻居 $\mathcal{N}_{\vdash}(v)$ 和输入层邻居 $\mathcal{N}_{\dashv}(v)$ ；
(3) 利用多层 $\text{GCN}$ 将实体 $v$ 的输入邻居的向量 $\{\textbf{h}_{u\vdash}^{k-1},\forall u\in\mathcal{N}_{\vdash}(v)\}$ 聚合为单一向量 $\textbf{h}_{\mathcal{N}_{\vdash}(v)}^k$ ，其中 $k$ 是迭代聚合的当前索引；
(4) 将实体 $v$ 当前的输入表示 $\textbf{h}_{v\vdash}^{k-1}$ 与新生产的邻居聚合向量 $\textbf{h}_{\mathcal{N}_{\vdash}(v)}^k$ 进行合并，并将合并的向量输入至全连接层，从而获得实体 $v$ 的新输入表示 $\textbf{h}_{v\vdash}^{k}$ ；
(5) 采用类似的方式获得实体 $v$ 的输出表示 $\textbf{h}_{v\dashv}^k$ ；
重复(3)-(5) K次，并将最终的输入表示和输出表示进行拼接，获得实体 $v$ 的最终向量表示。
通过该层最终能得到两个实体嵌入向量的集合 $\{\textbf{e}_1^1,\dots,\textbf{e}_{|G_1|}^1\}$ 和 $\{\textbf{e}_1^2,\dots,\textbf{e}_{|G_2|}^2\}$ 。

2. 节点级别(局部)匹配层

本层会对两个 $\text{topic entity graph}$ 中所有实体嵌入向量进行两两匹配。具体来说，这里使用了一种基于注意力的匹配方式。首先，计算图 $G_1$ 中实体 $e_i^1$ 与 $G_2$ 中所有实体 ${e_j^2\}$ 在表示空间中的 $\text{cosine}$ 相似度，
$\alpha_{i,j}=cosine(\textbf{e}_i^1,\textbf{e}_j^2)\quad j\in\{1,\dots,|G_2|\}$
将得到的相似度作为图 $G_2$ 中每个实体的权重进行加权求和
$\bar{\textbf{e}}_i^1=\frac{\sum_{j=1}^{|G_2|}\alpha_{i,j}\cdot\textbf{e}_j^2}{\sum_{j=1}^{|G_2|}\alpha_{i,j}}$
这里的操作类似文本匹配模型 $\text{ESIM}$ 的操作， $\bar{\textbf{e}}_i^1$ 是 $\textbf{e}_i^1$ 与 $G_2$ 中所有实体的相似性加权向量。

在为图 $G_1$ 和 $G_2$ 中所有实体计算出相似加权向量后，通过一种多视角 $\text{cosine}$ 匹配函数 $f_m$ 来计算最终的匹配向量
$\begin{aligned} &\textbf{m}_i^{att}=f_m(\textbf{e}_i^1,\bar{\textbf{e}}_i^1)\\ &\textbf{m}_j^{att}=f_m(\textbf{e}_j^2,\bar{\textbf{e}}_j^2) \end{aligned}$
其中，函数 $f_m$ 形式较为简单，详见原始论文附录。

3. 图级别(全局)匹配层

直觉上，匹配向量 $\textbf{m}^{att}$ 捕获了图 $G_1(G_2)$ 中每个实体如何匹配另一个图中所有实体的信息。然而，这样的匹配仅保留局部匹配信息，并没有充分利用全局信息。例如，在在 $G_1$ 和 $G_2$ 共现的实体中有许多实体仅有很少的邻居。对于这些实体，利用局部匹配信息会有很高概率的不正确。为了克服这个问题，论文利用另一个 $\text{GCN}$ 来将局部匹配信息传播至全图。

直觉上，局部匹配向量中保存了两个 $\text{topic entity graph}$ 如何匹配的信息，那么在整个知识图谱上使用 $\text{GCN}$ 将能够编码两个图的全局匹配信息。最后，论文将匹配向量表示输入全连接层中，并利用max pooling和mean pooling来生成固定长度的图匹配向量表示。