论文阅读“Embedding Graph Auto-Encoder for Graph Clustering”(TNNLS2022)

最新推荐文章于 2024-12-14 19:32:17 发布

不吃香菜的zbw

最新推荐文章于 2024-12-14 19:32:17 发布

阅读量1.6k

点赞数 1

分类专栏：论文阅读

本文链接：https://blog.csdn.net/qq_43497436/article/details/124614567

版权

深度学习机器学习计算机视觉

论文阅读专栏收录该内容

39 篇文章

订阅专栏

论文标题

Embedding Graph Auto-Encoder for Graph Clustering

论文作者、链接

作者：Zhang, Hongyuan and Li, Pei and Zhang, Rui and Li, Xuelong

链接：Embedding Graph Auto-Encoder for Graph Clustering | IEEE Journals & Magazine | IEEE Xplore

代码：GitHub - hyzhang98/EGAE: Implementation of "Embedding Graph Auto-Encoder for Graph Clustering", IEEE Transactions on Neural Networks and Learning Systems.

预备知识

标识

文中矩阵都用大写字母代表，向量都用小写字母代表。对于矩阵 $M$ ， $tr(M)$ 是矩阵的迹， $m\geq 0$ 表示矩阵所有元素都非负。 $diag(m)$ 表示一个主对角线元素是 $m_i$ 的对角矩阵。 $I$ 是单位矩阵， $\mathbf{1}_{n} \in \mathbb{R}^{n}$ 表示一个元素全为1的向量。如果 $x$ 是负的，那么 $sign(x)=-1$ ，其中 $sign(0)=0$ 。 $\nabla$ 是梯度操作。一般用 $n,d,c$ 代表数据大小，数据维度，簇的数量。给定一个数据集 $\{x_i\}^n_{i=1}$ 可以有以下表示：

聚类目标是将数据集 $\{x_i\}^n_{i=1}$ 分成 $c$ 个簇，并且有 $\{\mathcal{C}_i\}^c_{i=1}$ 。 $|\mathcal{C}_i|$ 代表分配给 $\mathcal{C}$ 的样本数量。假设用一个邻接矩阵 $A$ 来保存图谱。

图卷积

用邻接矩阵 $A$ 表示一个图谱， $A_{ij}=1$ 代表第 $i$ 个点和第 $j$ 个点之间有连接，否则 $A_{ij}=0$ 。 $\mathcal{L}=I-D^{-(1 / 2)} A D^{-(1 / 2)}$ 是正则化的拉普拉斯矩阵，其中 $D$ 是对角矩阵并且 $D_{i i}=\sum_{j=1}^{n} A_{i j}$ ，其中 $n$ 是图中的结点数目。图的空间信号 $x \in \mathbb{R}^n$ 可以转换到谱域通过 $Ux$ 其中 $\mathcal{L}=U^{T} \Lambda U$ 。如果卷积核 $\theta$ 被一个函数 $\Lambda$ 约束，那么一个谱卷积可以被如下定义：

假设 $g(\Lambda ; \theta)$ 是对角的矩阵并且可以用切比雪夫多项式逼近。如果使用线性近似，那么卷积可以定义为：

$f(\boldsymbol{x} ; \boldsymbol{\theta})=U^{T}\left(\theta_{0}-\theta_{1} \tilde{\Lambda}\right) U \boldsymbol{x}=\left(\theta_{0} I-\theta_{1} \tilde{\mathcal{L}}\right) \boldsymbol{x}$

其中， $\tilde{\Lambda}=\left(2 / \lambda_{\max }\right) \Lambda-I$ ， $\lambda _{max}$ 代表 $\mathcal{L}$ 的最大值，并且 $\tilde{\mathcal{L}}=U^{T} \tilde{\Lambda} U$ 。为了减少参数，假设 $\theta _0=-\theta _1$ 并且 $\lambda \approx 2$ 。因此，上述方程为 $f(\boldsymbol{x} ; \boldsymbol{\theta})=\theta_{0}\left(I+D^{-(1 / 2)} A D^{-(1 / 2)}\right) \boldsymbol{x}$ 。可以将卷积矩阵重新规范化为：

其中 $\hat{D}_{i i}=\sum_{j=1}^{n}(I+A)_{i j}$ 。因此，经过卷积处理的信号可以改写为 $f(\boldsymbol{x} ; \boldsymbol{\theta})=\theta_{0} \hat{\mathcal{L}} \boldsymbol{x}$ 。如果图信号是多维的并且 $d^\prime$ 卷积核是可以使用的，那么便有：

其中 $W \in \mathbb{R}^{d \times d^{\prime}}$ 是需要学习的参数。从空间的角度来说， $\hat{\mathcal{L}}$ 是 $I+A$ 的正则化拉普拉斯矩阵，也是原始图 $A$ 带自环结构的邻接矩阵。 $\hat{\mathcal{L}}X$ 等价于从邻居结点聚合信息即 $\hat{\boldsymbol{x}}_{i}=\sum_{j \in \mathcal{N}_{i}} \hat{\mathcal{L}}_{i j} \boldsymbol{x}_{i}$ ，其中 $\mathcal{N}_{i}$ 是结点 $x_i$ 的邻居结点， $\hat{x_i}$ 是 $\hat{\mathcal{L}}X$ 的第 $i$ 列的向量。

图自编码器

图自编码器GAE用多层的GCN去学习结点嵌入。GAE一般重构图谱结构，因为结点被视为一种弱的监督信息。具体来说，解码器计算两个结点的内积，将它们映射到概率空间通过sigmoid函数来计算相似性。

Introduction逻辑（论文动机&现有工作存在的问题）

聚类（图聚类），传统聚类没有利用图谱的结构信息，谱聚类模型没有使用结点特征——深度聚类深度聚类的算法没有利用结构信息——图聚类的一个高度相关的任务是网络嵌入，它是学习图节点的隐含表示(即embedding)的基本任务，基于图谱的算法没有进行域的转换，仅仅关心如何选择结点——GCN结合了基于图谱的模型和基于空间的模型，类GCN方法往往存在过拟合的问题，并且大多数忽略了生成的表示的关键特征，导致一些不合适的聚类方法应用于嵌入。并且将聚类过程和GAE的训练过程分开——本文方法