论文阅读：Towards Faster Deep Graph Clustering via Efficient Graph Auto-Encoder-CSDN博客

本文链接：https://blog.csdn.net/dundunmm/article/details/144835209

论文地址：Towards Faster Deep Graph Clustering via Efficient Graph Auto-Encoder | ACM Transactions on Knowledge Discovery from Data

代码地址： https://github.com/Marigoldwu/FastDGC

摘要

深度图聚类（Deep Graph Clustering, DGC）近年来已成为图数据聚类的一个有前途的方法。然而，现有研究主要通过提高嵌入表示的质量来优化聚类结果，这往往导致模型复杂且运行速度较慢。此外，这些方法在更新节点嵌入后，在迭代优化过程中未能考虑节点相似度的变化以及对原始结构的相应调整，容易出现表示崩溃问题。为了解决这些问题，作者提出了一种高效图自动编码器（Efficient Graph Auto-Encoder, EGAE）和动态图权重更新策略，构成了本文提出的快速深度图聚类（FastDGC）网络的基础。

具体来说，作者通过线性变换大幅度降低特征维度，同时保留原始节点的相似性。随后，采用单层图卷积过滤近似替代多层图卷积神经网络，从而降低计算复杂度和参数数量。在迭代过程中，利用线性变换后的特征计算节点之间的相似度，并定期更新原始图结构，减少低相似度的边，以增强判别性和聚合性表示的学习。理论分析表明，EGAE具有较低的计算复杂度。基于标准数据集的大量实验表明，与最先进的方法相比，作者提出的方法不仅提高了聚类性能，还实现了2到3个数量级的速度提升，展现了卓越的性能。

引言

无监督学习旨在从无标签数据中识别复杂模式，使机器能够胜任各种场景中的无监督任务。作为最经典的无监督任务之一，聚类在过去几十年中得到了广泛研究。然而，近年来，对图数据的聚类提出了新挑战，因为它需要学习属性信息并挖掘节点之间的结构信息。由于对结构信息的需求，传统方法已达到瓶颈。随着图神经网络（Graph Neural Networks, GNNs）的引入，探索节点间结构信息取得了新进展，将图数据聚类推向了前所未有的高度。在此背景下，各种基于GNN的图聚类方法相继涌现。

其中，图卷积神经网络（Graph Convolutional Network, GCN）、图自动编码器（Graph Auto-Encoder, GAE）和图注意力网络（Graph Attention Network, GAT）作为挖掘图数据的重要方法，引起了广泛关注。这些方法通常将高维节点特征嵌入到低维表示中以进行聚类。GAE通过堆叠不同大小的GCN对高维特征进行编码，并通过简单的解码器重构邻接矩阵。随后，通过最小化输入和输出之间的重构损失，获得节点的低维特征。然而，GAE面临表示崩溃（Representation Collapse）的问题。为了解决这一问题，Liu等人提出了双相关性减少网络（Dual Correlation Reduction Network, DCRN），Gong等人提出了基于双冗余减少的属性图聚类方法（Attribute Graph Clustering with Dual Redundancy Reduction, AGC-DRR）。

DCRN通过Siamese网络对样本进行编码，然后逼近跨视图样本相关矩阵和跨视图特征相关矩阵至单位矩阵，从