02_GraphAugmentationClusteringNetwork
Title:图增强聚类网络
Abstract
- 现存方法的缺点:极大的依赖于原始图的质量
- 解决方法:图增强聚类,自适应的增强原始图来实现更好地聚类效果
- 具体方法:
- 合并节点属性与拓扑图结构信息,学习潜在的特征表示
- 在嵌入空间中探索局部几何结构信息构建邻接图
- 使用自适应图图增强结构来融合初始图与邻接图
- 最小化多个衍生分布的Jeffreys散度,使用无监督方式进行训练
Introduction
- DAE:深度自动编码器网络关注于节点特征信息
- DEC:深度嵌入聚类网络通过重建损失改善性能
- 对于以DAE基础的网络缺点:忽略了输入的拓扑结构信息
- GCN通过传播学习空间临近邻居的表示来实现深度嵌入学习,从而弥补DAE的缺点。通过连接DAE与GCN网络实现节点属性与拓扑结构信息的融合
- 本篇文章的贡献:图增强->通过探索网络本身的结构信息来动态的增强初始图
- 具体步骤:
- 使用GCN与DAE进行图嵌入学习
- 在嵌入空间中通过局部几何结构来构建邻接图
- 提出具有多层感知器层与一系列归一化项的自适应图增强模块,来进行原始图与邻接图的融合
- 最小化多个衍生分布的Jeffreys散度,使用无监督方式进行训练
Proposed Method
模块:深度自动编码模块、图嵌入学习模块、图增强模块
Feature Representation Learning
- 通过DAE与GCN分别提取节点属性与拓扑图结构信息来实现特征表示
- 使用DAE通过最小化重建损失来提取潜在的特征表示Hi
3.使用拉普拉斯平滑算子与激活函数合并数据与邻居信息Zi
4.使用MLP与归一化操作融合嵌入向量表示与图的拓扑结构Zi(′)
5.聚合不同的GCN层的输出,充分利用结构信息(充分利用1近邻、 2近邻...n近邻结构信息) Z'
6.使用拉普拉斯平滑技术与可学习参数矩阵得到最后的向量表示Za
Graph Augmentation Learning
- 之前的图聚类网络严重依赖于预定义的图,如果预定义的图的质量不高,学的出来特征可能会比较差。启示我们自适应的增强图,而不是依赖于预定义的图
- 我们根据特征表示模块得到的Za来重建图,计算它的相似度矩阵,将相似度矩阵减去对角线矩阵。每一行最大的保持不变,其他的置 为0,之后将对角线元素置为1
3.融合构建出来的图与原始的图,其中Az = D1 G,其中Dz是构建图的度矩阵
Clustering Optimization
- 首先根据t分布衡量嵌入向量hi与这一类的质心向量μj的相似度,对于相似度矩阵Q的每一个元素:
2.训练的结果是根据Za得到聚类结果
3.根据Za得到辅助分布P,为了实现多个导出分布的一致对齐, 4.最小化Q ,Za和P之间的Jeffreys散度,得到最后的损失函数