图自编码器的起源和应用

最新推荐文章于 2024-08-13 08:51:01 发布

LiuHDme

最新推荐文章于 2024-08-13 08:51:01 发布

阅读量2.4k

点赞数 4

分类专栏：图神经网络文章标签：机器学习人工智能深度学习神经网络算法

本文链接：https://blog.csdn.net/LiuHDme/article/details/104775711

版权

在这里插入图片描述
此文章同步发布于 paperweekly
图自编码器的起源和应用

0. 介绍

Kipf 与 Welling 16 年发表的「Variational Graph Auto-Encoders」提出了基于图的（变分）自编码器 Variational Graph Auto-Encoder（VGAE），自此开始，图自编码器凭借其简洁的 encoder-decoder 结构和高效的 encode 能力，在很多领域都派上了用场。

本文将先详尽分析最早提出图自编码器的「Variational Graph Auto-Encoders」这篇论文，将从以下几个角度进行分析：

VGAE 的思想
没有变分阶段的 GAE 的 encoder、decoder 阶段
有变分阶段的 VGAE 如何从确定分布再到从分布中采样
实验效果分析

然后会再介绍两篇关于如何应用图自编码器的文章。

1. Variational Graph Auto-Encoders

论文链接：http://bayesiandeeplearning.org/2016/papers/BDL_16.pdf

1.1 论文概览

先简单描述一下图自编码器的intention 和用途：获取合适的 embedding 来表示图中的节点不是容易的事，而如果能找到合适的 embedding，就能将它们用在其他任务中。VGAE 通过 encoder-decoder 的结构可以获取到图中节点的 embedding，来支持接下来的任务，如链接预测等。

VGAE 的思想和变分自编码器（VAE）很像：利用隐变量（latent variables），让模型学习出一些分布（distribution），再从这些分布中采样得到 latent representations（或者说 embedding），这个过程是 encode 阶段，然后再利用得到的 latent representations 重构（reconstruct）出原始的图，这个过程是 decode 阶段。只不过，VGAE 的 encoder 使用了 GCN，decoder 是简单的内积（inner product）形式。

下面具体讲解变分图自编码器（VGAE）。先讲 GAE，即图自编码器（没有变分）。

1.2 图自编码器（GAE）

统一规范，规定几个 notation 如下：

图用 $\mathcal{G} = (\mathcal{V}, \mathcal{E})$ 表示，其中 $\mathcal{V}$ 表示节点集合， $\mathcal{E}$ 表示边集合
$\mathbf{A}$ : 邻接矩阵
$\mathbf{D}$ : 度矩阵
$N$ : 节点数
$d$ : 节点的特征（features）维度
$\mathbf{X} \in \Bbb{R}^{N \times d}$ 表示节点的特征矩阵
$f$ : embedding 维度
$\mathbf{Z} \in \Bbb{R}^{N \times f}$ : 节点的 embedding

1.2.1 Encoder

GAE 使用 GCN 作为 encoder，来得到节点的 latent representations（或者说 embedding），这个过程可用一行简短的公式表达：

$\mathbf{Z} = \mathrm{GCN}(\mathbf{X}, \mathbf{A})$

将 $\mathrm{GCN}$ 视为一个函数，然后将 $\mathbf{X}$ 和 $\mathbf{A}$ 作为输入，输入到 $\mathrm{GCN}$ 这个函数中，输出 $\mathbf{Z} \in \Bbb{R}^{N×f}$ ， $\mathbf{Z}$ 代表的就是所有节点的 latent representations，或者说 embedding。