多视角聚类论文笔记(一)Partial Multi-View Clustering via Self-Supervised Network(PVC-SSN)【不完全多视角聚类】

The Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24)

Wei Feng, Guoshuai Sheng, Qianqian Wang, Quanxue Gao, Zhiqiang Tao, Bo Dong


一、解决问题

  1. 大多数现存不完整多视角聚类方法无法从视角之间存在较大差异的不完全多视角数据中学习准确的共同聚类结构。
  2. 聚类是一种无监督方法,现有的PMVC方法忽略了样本中的判别信息。

二、方法

  • 主要思想

        利用深度多视角对比编码器网络来减少潜在子空间的差异,通过最大化多个视角之间的一致性来实现;

        在潜在子空间表示中,嵌入自表达层来学习一致子空间表示;

        设计多视角编码器网络来重构原始数据样本,确保子空间表示的有效性;

  • 模型图

由三个子模块组成:

  • Multi-view Contrastive Encoder Network

  •  论文有一个数据预处理操作:将原始数据分成两部分:

        paired data(不存在缺失样本的视角集合);

        unpaired data(存在确实样本的视角集合)

  •  该模块的主要工作:

将不同视角的原始数据通过编码器得到潜在子空间表示z^{i},然后不直接在每个Z上做对比学习,而是将z^{i}经过一个对比头网络g_{i}(实际上就是一个单层非线性层网络)得到对比嵌入特征Q^{i},继而在Q^{i}上做对比学习

Q^{i}上做对比学习中正负样本的构建方法还挺有意思:用对应的伪标签P来指导正负样本的构建,也就是说,Q^{i}中同属于同一簇的样本就视为正样本对。

相关公式:

 

  • Self-expression Learning Layer 

 该模块的主要工作: 将潜在子空间表示z^{i}加权融合得到共同子空间表示Z,通过自监督学习Z的线性表示,即Z=ZS,从而不断学习到自监督稀系数矩阵S(实际上就是相似度矩阵?),从S中获得亲和矩阵C,然后在C上做谱聚类得到伪标签矩阵P。

相关公式:

 

  • Multi-view Decoder Network 

 三、损失函数

  1. 对比损失
  2. 自表示损失
  3. 重构损失

其中,预训练阶段损失: 

正常训练阶段损失:

四、实验结果

 五、收获

  1. 让低维特征通过单层非线性层后再进行对比学习,用伪标签来指导对比学习的正负样本对构建;
  2. 用自监督学习融合特征的线性表示从而使得相似度矩阵能够通过网络来学习得到
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值