《Graph Representation Learning》Chapter3-Neighborhood Reconstruction Methods

瑞克曼德

已于 2023-11-28 19:13:31 修改

阅读量900

点赞数 21

分类专栏：图表示学习学习笔记文章标签：笔记

于 2023-11-28 19:09:21 首次发布

本文链接：https://blog.csdn.net/weixin_44783584/article/details/134674412

版权

图表示学习学习笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Neighborhood Reconstruction Methods

文章目录

Neighborhood Reconstruction Methods

在这里插入图片描述

在正文开始之前，有必要先了解一下节点嵌入问题。如上图所示，节点嵌入的目标是学习一个编码器 $ENC (\cdot)$ 将节点映射到低维嵌入空间中，然后通过其在嵌入空间中的距离来反映原始图中节点的相对位置。

An Encoder-Decoder Perspective

在这里插入图片描述

上图中，编码器将节点 $u$ 映射到低维嵌入 $z_u$ ，然后通过解码器使用 $z_u$ 来重建 $u$ 的局部邻域信息。下面将在类似的 Encoder-Decoder 框架下探讨节点嵌入问题。

The Encoder

最基本的编码器可表示为： $\rightarrow \R^d$ ，其使用每个节点的 ID 生成节点嵌入。

浅嵌入（shallow embedding）方法： $\mathbf{Z}[v], \mathbf{Z} \in \R^{|V| \times d}$ ，该编码器的功能只是基于节点 ID 的嵌入查找。

The Decoder

成对（pairwise）解码器： $\R^d \times \R^d \rightarrow \R^+$ 、 $DEC(\mathbf{z}_u,\mathbf{z}_v) \approx \mathbf{S}[u,v]$ ， $\mathbf{S}[u,v]$ 可看作节点之间基于图的相似性度量（真实值），成对解码器可以解释为预测节点对之间的关系或相似性。将成对编码器用于一对嵌入 $(\mathbf{z}_u,\mathbf{z}_v)$ 会重建节点 $u$ 和 $v$ 之间的关系，目标就是优化编码器和解码器以最小化重建损失。

Optimizing an Encoder-Decoder Model

实现上述目标的标准做法是最小化一组训练节点对 $D$ 上的经验损失 $\mathcal{L} \space (\mathcal{L}=\sum_{u,v\in D}\mathcal{l}(DEC(\mathbf{z}_u,\mathbf{z}_v),\mathbf{S}[u,v]))$

Overview of the Encoder-Decoder Approach

在这里插入图片描述

上表是一些著名的浅层嵌入方法总结。编码器-解码器框架的主要好处是：允许人们根据解码器函数、图的相似性度量和损失函数来简介的定义和比较不同的嵌入方法。

分割线以上的方法被称为矩阵分解方法，可以使用分解算法（例如，奇异值分解 (SVD) ）来最小化他们的损失函数。通过将节点嵌入 $\mathbf{z}_u \in \R^d$ 堆叠到矩阵 $\mathbf{Z} \in \R^{|\mathcal{V}| \times d}$ 中，可将重建目标写为 $\mathcal{L} \approx ||\mathbf{Z}\mathbf{Z}^{T}-\mathbf{S}||^2_2$ ，它对应于节点间相似度矩阵 S 的低维因式分解。
随机游走嵌入不直接重建邻接矩阵 A 或 A 的某些确定性函数，而是优化嵌入以对随机游走的统计数据进行编码。 $\mathcal{p_G(v|u)}$ 是在从 u 开始的长度为 T 的随机游走中访问 v 的概率，T 通常定义在 2-10 之间，随机且不对称。DeepWalk 使用分层 softmax来逼近目标，node2vec 则采用噪声对比方法。
Large-scale information network embeddings (LINE)：结合两个编码器-解码器目标，显式地重建一阶和二阶邻域信息来代替随机游走。
Additional variants of the random-walk idea：随机游走方法的好处之一是可以通过偏置或修改随机游走来扩展和修改它。

Random walk methods and matrix factorization

随机游走方法实际上与矩阵分解方法密切相关。假设我们定义以下节点间相似度值矩阵：
$\mathbf{S}_{DW} = \log \left(\frac{vol(\mathcal{V})}{T} \left(\sum_{t=1}^T \mathbf{P}^t \right)\mathbf{D}^{-1}\right)-\log (b)、\mathbf{P}=\mathbf{D^{-1}A}\\ \left(\sum_{t=1}^T \mathbf{P}^t \right)\mathbf{D}^{-1} = \mathbf{D}^{-\frac{1}{2}} \left(\mathbf{U} \left(\sum_{t=1}^T \mathbf{\Lambda}^t \right)\mathbf{U}^{T}\right) \mathbf{D}^{-\frac{1}{2}}$
其中 $\mathbf{UΛU}^T = \mathbf{L}_{sym}$ 是对称归一化拉普拉斯算子的特征分解。在这种情况下，DeepWalk 学习到的嵌入 Z 满足 $\mathbf{ZZ^T \approx S}_{DW}$ 。