Self-Guided Partial Graph Propagation for Incomplete Multiview Clustering
原文链接
大多数现有的方法都是在实例级别解决不完整性问题,它们需要足够的信息来执行数据恢复。
本文提出了一种基于图传播视角的新方法来促进IMVC。具体来说,使用部分图来描述不完整视图的样本相似性,这样缺失实例的问题就可以转化为部分图的缺失条目。利用一致性信息,可以自适应地学习公共图来自引导传播过程,并依次使用每个视图的传播图以迭代的方式改进公共自引导图。因此,通过利用所有视图中的一致性信息,可以通过图传播推断出相关的缺失条目。
另一方面,现有的方法只关注一致性结构,由于数据的不完整性问题,没有充分利用互补信息。相比之下,在本文提出的图传播框架下,本文的方法采用排他的正则化项来利用互补信息。
Fig1.Top:IMVC场景,某些视图中可能缺少一些实例(例如实例1):由于数据的不完整,难以探索互补和一致性信息。
Fig1.Bottom:方法的主要思想:缺失数据的问题可以转化为部分图的缺失条目,而不是直接在实例级解决不完备问题,而提出的图传播方法可以推断出相关的缺失条目。
方法
先验知识
缺失指示矩阵
定义一个有序索引集ζ k∈R n k (n k≤n为第k个视图中已完成实例的个数)来表示该实例的索引在第k个视图中可用。
部分图传播
一个部分图传播框架来推断每个视图的缺失信息
原始部分图Q,A = {a1, a2,…, A m}∈R n×n是每个视图的传播图。W为全局一致性图,可以将其表述为一个拉普拉斯正则化问题,以指导传播过程在所有视图中利用一致性信息。
第4项转为拉普拉斯正则化问题,可用于指导利用一致性信息的传播过程在所有视图。
第6项在所有视图中采用一个独占正则化项来加强传播图的多样性。
W和A应该提前知道,但在迭代过程中更新得到最优解。
Fig3:本方法有两个关键的学习组件:部分图学习和部分图传播。部分图学习的目的是为每个不完整视图生成部分相似图。偏图传播能够对每个偏图的缺失信息进行推断。在偏图传播中,可以对偏图、传播图和公共图进行协同提升。图的传播过程是在部分图上进行的,互补信息可以跨所有视图进行探索(绿色虚线),红色虚线表示通过公共图的一致性来指导图的传播。注意,公共图可以基于这些传播的图自适应地更新。
在这项工作中,作者从图传播的角度解决了IMVC的挑战性问题。在该框架中,对于每个不完整视图,将缺失实例的问题转化为部分图的缺失条目,并通过发现一致性信息,通过图传播来推断相关的缺失条目。此外,可以自然地采用排他性正则化方法来同时利用互补信息。实验结果证明了所提出的图传播方法在IMVC任务中的有效性。此外,作者还将提出的方法应用于新的生物发现任务(癌症亚型),并表明本方法可以作为一种强大的算法来克服该任务中数据缺失的挑战。