The Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24)
Wei Feng, Guoshuai Sheng, Qianqian Wang, Quanxue Gao, Zhiqiang Tao, Bo Dong
一、解决问题
- 大多数现存不完整多视角聚类方法无法从视角之间存在较大差异的不完全多视角数据中学习准确的共同聚类结构。
- 聚类是一种无监督方法,现有的PMVC方法忽略了样本中的判别信息。
二、方法
-
主要思想
利用深度多视角对比编码器网络来减少潜在子空间的差异,通过最大化多个视角之间的一致性来实现;
在潜在子空间表示中,嵌入自表达层来学习一致子空间表示;
设计多视角编码器网络来重构原始数据样本,确保子空间表示的有效性;
-
模型图
由三个子模块组成:
-
Multi-view Contrastive Encoder Network
- 论文有一个数据预处理操作:将原始数据分成两部分:
paired data(不存在缺失样本的视角集合);
unpaired data(存在确实样本的视角集合)
- 该模块的主要工作:
将不同视角的原始数据通过编码器得到潜在子空间表示,然后不直接在每个Z上做对比学习,而是将经过一个对比头网络(实际上就是一个单层非线性层网络)得到对比嵌入特征,继而在上做对比学习
在上做对比学习中正负样本的构建方法还挺有意思:用对应的伪标签P来指导正负样本的构建,也就是说,中同属于同一簇的样本就视为正样本对。
相关公式:
;
-
Self-expression Learning Layer
该模块的主要工作: 将潜在子空间表示加权融合得到共同子空间表示Z,通过自监督学习Z的线性表示,即Z=ZS,从而不断学习到自监督稀系数矩阵S(实际上就是相似度矩阵?),从S中获得亲和矩阵C,然后在C上做谱聚类得到伪标签矩阵P。
相关公式:
-
Multi-view Decoder Network
三、损失函数
- 对比损失
- 自表示损失
- 重构损失
其中,预训练阶段损失:
正常训练阶段损失:
四、实验结果
五、收获
- 让低维特征通过单层非线性层后再进行对比学习,用伪标签来指导对比学习的正负样本对构建;
- 用自监督学习融合特征的线性表示从而使得相似度矩阵能够通过网络来学习得到