【论文阅读】Simple Contrastive Graph Clustering

秋冬无暖阳°

已于 2023-02-27 21:12:46 修改

阅读量2.2k

点赞数 1

分类专栏： # GNN 聚类（图聚类）论文阅读文章标签：论文阅读聚类算法

于 2023-02-08 21:59:18 首次发布

本文链接：https://blog.csdn.net/qq_51392112/article/details/128943812

版权

论文阅读同时被 3 个专栏收录

28 篇文章 1 订阅

订阅专栏

GNN

12 篇文章 0 订阅

订阅专栏

聚类（图聚类）

9 篇文章 2 订阅

订阅专栏

Simple Contrastive Graph Clustering（简易的对比图聚类）

文章目录

Simple Contrastive Graph Clustering（简易的对比图聚类）

1. 来源

				2022 arxiv

2. 动机

对比学习因其良好的性能而在深度图聚类中引起了广泛的关注。

然而，复杂的数据扩充和耗时的图卷积操作削弱了这些方法的效率。

为了解决这一问题，作者提出了一个简单的对比图聚类（SCGC）算法，从网络架构、数据增强和目标函数的角度来改进现有的方法。在架构方面，网络包括两个主要部分，即预处理和网络骨干。

一个简单的低通去噪操作将邻居信息聚合作为一个独立的预处理，并且只包含两个多层感知器（MLPs）作为主干。
对于数据增强，模型没有在图上引入复杂的操作，而是通过设计参数非共享的暹罗编码器和直接干扰节点嵌入来构造同一顶点的两个增强视图。
最后，在目标函数方面，为了进一步提高聚类性能，设计了一种新的跨视图结构一致性目标函数，以提高学习网络的判别能力。

3. 模型框架

首先通过低通去噪操作对节点属性进行预处理。
然后，结构对比模块仅用两个mlp对平滑的节点属性进行编码；
并通过设计参数非共享的暹罗编码器和扰动节点嵌入来构建节点嵌入的增强视图。
此外，还设计了一种新的面向邻居的对比损失，以保持横视图结构的一致性，从而提高了网络的鉴别能力。

4. 方法介绍

4.1 总览

作者提出了一种简单的对比图聚类（SCGC）算法。SCGC的框架如上图所示。它主要由低通去噪操作和结构对比模块（SCM）两个组件组成。

4.2 低通去噪操作

最近的一些工作已经证明了拉普拉斯滤波器可以达到与图卷积运算相同的效果。由于它们的成功，作者引入了一个低通去噪操作，在训练前将邻居信息聚合作为一个独立的预处理。这样，就可以有效地过滤出属性中的高频噪声。具体地说，模型引入了一个图拉普拉斯滤波器：

其中 $\tilde L$ 为对称归一化图的拉普拉斯矩阵。随后，叠加 t 层的图拉普拉斯滤波器如下：

其中， $X_s$ 表示平滑的属性矩阵。此外， $H^t$ 表示堆叠的t层图拉普拉斯滤波器，它可以滤除节点属性中的高频噪声。

通过这种低通去噪操作，过滤掉了属性中的高频噪声，从而提高了聚类性能和训练效率。

4.3 结构对比模块

在本节中，作者设计了结构对比模块（SCM），以保持即使跨两个不同的视图的结构一致性，从而提高了网络的鉴别能力。

具体来说，作者首先用设计的参数非共享MLP编码器对平滑属性Xs进行编码，然后用 $l^2$ -norm对学习到的节点嵌入进行归一化如下：

其中 $Z ^{v_1}$ 和 $Z ^{v_2}$ 表示学习节点嵌入的两个增广视图。值得一提的是，MLP1和MLP2具有相同的架构，但参数不共享，因此 $Z ^{v_1}$ 和 $Z ^{v_2}$ 在训练过程中会包含不同的语义信息。

此外，作者通过简单地在 $Z ^{v_2}$ 中加入随机高斯噪声，进一步保持了两种视图之间的差异：

其中， $N∈R^{N×d}$ 从高斯分布N（0，σ）中采样。

综上所述，作者通过设计参数非共享编码器，直接扰动节点嵌入，而不是对图引入复杂的操作，构造了两个增强视图 $Z ^{v_1}$ 和 $Z ^{v_2}$ ，从而提高了训练效率。此外，最近的研究表明，复杂的数据在图上的扩充，如加边、掉边和图扩散，可能会导致语义漂移。通过实验也验证了类似的结论。

随后，作者设计了一种新的面向邻居的对比损失来保持横视图结构的一致性。具体地说，我们计算了 $Z ^{v_1}$ 和 $Z ^{v_2}$ 之间的交叉视图样本相似度矩阵 $S∈R^{N×N}$ ，公式如下：

其中， $S_{ij}$ 表示第一个视图中第 $i$ 个节点嵌入与第二个视图中第 $j$ 个节点嵌入的余弦相似度。然后，我们强制交叉视图样本相似度矩阵 $S$ 等于自环邻接矩阵 $\hat A∈R^{N×N}$ ，如公式所述：

其中， $1^1 _{ij}$ 表示如果 $\hat A_{ij}=1$ ， $1^0 _{ij}$ 表示如果 $\hat A_{ij}=0$ 。在这里，将同一节点的交叉视图邻居视为正样本，而将其他非邻居节点视为负样本。然后把阳性样本拉在一起，同时推开阴性样本。