提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
目录
前言
一、Contrastive deep embedded clustering(CDEC)论文的学习
二、GCFAgg: Global and Cross-view Feature Aggregation for Multi-view Clustering(GCFAgg)论文的学习
一、CDEC
1、目的:在DEC的基础上,加入了对比学习,通过最大化正负样本对之间的距离,学习到更具代表性的特征。实验效果高于单纯的DEC。
2、过程:
①输入数据X通过降噪自动编码器获得低维数据空间
②预训练:最小化对比损失与聚类损失对模型进行预训练(先通过下方的模块得到重构数据,再将输入数据与重构数据进行对比学习)
③最终模型:通过联合对比损失、聚类损失、重构损失训练CDEC。在Z上进行k-means算法得到最终聚类结果。
3、主要贡献:
①该网络可以将样本从复杂的原始数据空间映射到有区别的潜在空间,并从不同的聚类中捕获样本之间的区别信息。
②为了更好地区分混淆样本,设计了一种结合对比损失和重构损失约束的训练损耗。
4、代码部分
二、GCFAgg:多视图聚类的全局和跨视图特征聚合
1、目的:在多视图聚类过程中,通过引入全局结构性引导的对比学习模块,尽量避免将可能来自同一类别的样本对的相似度得分低的问题。避免传统融合视图的方法:只注重视图内部信息,忽视样本之间结构相似度导致的聚类质量差的问题。
ps:"样本的结构关系" 指的是数据样本之间的相互关系和组织结构,即数据样本之间的相似性、距离和关联等。
2、过程:
①将多视图的数据通过预训练好的自动编码器得到数据空间Z经过多层感知机得到低维数据空间。
②将所有视图的Z整合起来通过GCFAgg模块得到变化后的Z_bar以及样本间的结构关系S,Z_bar经过MLP得到低维表示。
③在SgCL模块,利用结构关系S引导共识表示和特定视图表示的对比学习模块,使相似样本的表示具有高度的结构。
④利用k-means得到模型结果。
ps:由transformer attention mechanism的启示,可得到样本的结构相似性S以及变化后的Z_bar
如下代码所示:
总结:设计了全局和跨视图的特征聚合模块,该模块通过整合变压器结构,从不同的特征空间中学习全局结构关系,然后根据学习到的全局关系得到一致表示;充分利用了相似样本的互补信息,从而减少噪声和冗余或样本缺失对不同视图的影响。此外,通过全局结构引导,将共识表示和特定视图表示结合起来对比学习模块,使相似样本的表示具有高度的结构关系相似度。
3、主要贡献:
①充分挖掘相似样本的互补性,解决了同一聚类中不同样本的负对具有较低相似性得分的问题。将特征融合得到的结构关系 S 加入到负对中,保证了只最小化来自不同低结构关系样本的特定视图表示与一致表示之间的相似性。对于正对,该方法将学习到的一致性表示与视图特异性表示进行了对齐,使得结构关系高的正对的表示更加相似,因为其他高相关性的样本增强了一致性表示。
②该模块通过整合变压器结构,从不同的特征空间中学习全局结构关系,然后根据学习到的全局关系得到一致表示;充分利用了相似样本的互补信息,从而减少噪声和冗余或样本缺失对不同视图的影响。此外,我们通过全局结构引导,将共识表示和特定视图表示结合起来对比学习模块,使相似样本的表示具有高度的结构关系相似度。
4、代码部分