作者:Xincan Lina,b, Jie Liana,b, Zhihao Wua,b, Jielong Lua,b, Shiping Wanga,b,∗
aCollege of Computer and Data Science, Fuzhou University, Fuzhou 350116, China
bKey Laboratory of Intelligent Metro, Fujian Province University, Fuzhou 350108, China
引用:Lin X, Lian J, Wu Z, et al. Deep Dual Contrastive Learning for Multi-View Subspace Clustering[J]. Available at SSRN 4706044.
摘要
多视图子空间聚类(MVSC)旨在利用所有视图的一致性和互补性来学习一致的共享自表示,许多MVSC算法试图直接从原始特征中获得最优表示。然而,它们可能会忽略原始特征空间中的噪声或冗余信息,导致学习次优自表示和较差的性能。为了解决这一限制,一个直观的想法是引入深度神经网络来消除噪声和冗余,从而产生潜在的嵌入空间。然而,现有的深度MVSC方法只关注嵌入或自表达来探索互补信息,这阻碍了子空间学习。在本文中,我们提出了一个深入的多视图对偶对比子空间聚类框架,以有效地利用互补性来学习潜在的自我表征。具体而言,构造多视图编码器以消除原始特征的噪声和冗余,并捕获低维子空间嵌入,从中学习自表示。此外,对潜在子空间嵌入和自表达进行了两种不同的具体融合方法,以学习共享的自表示,并提出了双重对比约束,以充分利用视图之间的互补性。进行了大量的实验来验证所提出的方法的有效性。
一、引言
在信号处理中,从不同资源或不同形式捕获的数据被称为多视图数据。例如,图像的纹理或边缘等特征被提取为多个视图,同一新闻的不同报道也可以被视为新闻的不同特征。随着多视图学习的兴起,最近出现了大量的多视图数据[1,2,3,4]。作为一种无监督的范式,多视图聚类得到了极大的关注[5],其目的是利用多视图的一致性和互补性来学习一致性表示,以提高聚类性能。根据方法论的类型,多视图聚类算法通常可分为三种形式:多视图谱聚类[6,7,8],多视图子空间聚类[9,10,11],非负矩阵分解多视图聚类[12,13,14]。
此外,还提出了其他几项工作,以从原始特征有效地执行子空间聚类[15,16,17]。然而,原始特征空间通常包含噪声和冗余,并且这些直接从这种特征空间挖掘自表达信息的方法往往会学习次优的自表示,这导致性能下降。
因此,已经提出了大量的研究来推导用于最优自表示学习的有效的低维特征空间。[18]没有使用原始特征,而是追求全面的潜在嵌入来探索互补信息,促进了在这些学习嵌入空间中的一致自表示学习。类似地,[19]提出构建潜在一致表示,并引入HSIC来捕捉视图之间的高阶和非线性关系。[20] 同时进行特征投影和自表示,挖掘共享信息和特定信息,利用低维特征进行重构。此外,[21]在一个统一的框架中联合学习了隐式嵌入空间、鲁棒相似性矩阵和精确的聚类指标矩阵。然而,这些方法在处理以非线性数据关系为特征的复杂特征时表现不佳。
幸运的是,由于其强大的表示提取能力,深度学习被引入到MVSC方法中来探索非线性信息。例如,[18]使用深度神经网络来推广所提出的发现非线性数据关系的方法。[22]提出了一种深度多视图子空间聚类网络,将全局和局部结构与自我表达层相结合,[23]甚至利用数据亲和关系来指导嵌入学习过程。此外,[24]将信息瓶颈扩展到深子空间聚类,旨在学习最小的充分表示。由于对比学习能够捕捉判别表示,[25]获得了节点的平滑表示,并通过采用图对比正则化。[26]提出了两个关于高级特征和语义标签的对比目标,以探索共同的语义。尽管深度MVSC方法取得了很好的性能,但它们仍然可能获得不完整的自我表征,这是由于仅考虑自我表达水平或嵌入水平的相互信息融合造成的。
为了解决上述局限性,我们提出了一种深度多视图对偶对比聚类网络。这种方法试图联合学习子空间嵌入和自表示,并通过最大化互信息来利用互补信息。具体而言,构建多视图自动编码器以消除噪声和冗余,同时获得有效的嵌入,并构建自表达层以探索视图特定的自表示。此外,引入了两个不同的融合层,以提取共享的一致的自我嵌入和自表示。为了充分利用不同观点之间的互补性,我们提出了在自我嵌入和自我表达两个层面上的双对比学习。