Partition level multiview subspace clustering
原文链接:
https://www.sciencedirect.com/science/article/pii/S0893608019303326
Abstract
多视角子空间聚类主要集成数据点所在空间的多视图信息,它的性能可能受到每个单独视图中存在的噪声或异构特征之间不一致的影响。对于多视角聚类,基本前提是所有视图之间存在共享分区, 因此,多视图聚类的自然空间应该是所有分区。我们建议在分区级融合多视图信息,遵循两个直观的假设:(i)每个分区都是一致性聚类的扰动;(ii)对接近一致性聚类的分区赋较大的权值。
本文提出了一个统一的多视图子空间聚类模型,该模型包含每个视图的图学习、基本分区的生成和共识分区的融合。这三个组成部分无缝集成,通过迭代的方式相互促进,从而得到一个整体的最佳解决方案。
Introduction
为了获得多视角一致性图,我们基于两个直观假设,在分区级别上融合多视图信息,并实现了一致性聚类。换句话说,我们通过从视图的多个聚类结果中找到共享聚类来集成多视图信息。
从数据空间的角度移动到自然空间(所有分区的空间)进行聚类,这种范式的变化伴随着一些优势,首先,合并来自每个视图的各个分区与最终结果之间的交互。其次,它继承了集成学习的鲁棒性和良好的经验性能。第三,多视图聚类方法在分区级集成多视图信息,而不是在图构建阶段集成多视图信息,提高了多视图聚类方法的表示能力。我们直接将多个分区融合为一个集成的分区,因为多视图聚类的前提是存在一个共享的簇结构。除了融合基本分区外,我们还进一步将其与图结构结合起来。在此基础上,建立了一个集图构造、谱聚类和一致性聚类于一体的统一框架。基于迭代优化策略,采用高质量一致性聚类指导基本分区图的构建和更新,形成新的共识分区。
本文所用方法的流程图:在每次迭代中动态构建每个视角的图,进行谱聚类得到每个视角的分区,并整合基本分区生成最终的聚类结果。
Related work
子空间聚类(SC)
给定一个数据集
X
=
[
x
1
,
x
2
,
…
…
,
x
n
]
∈
R
m
×
n
\bf{X}=[x_1,x_2,……,x_n] \in\bf{R}^{m \times n}
X=[x1,x2,……,xn]∈Rm×n,SC可以通过所谓的“自表达性”属性学习亲和图矩阵
Z
\bf{Z}
Z,这说明每个数据点都可以表示为其他点的线性组合,即对
∀
x
i
\forall{x_i}
∀xi,
x
i
=
∑
j
x
j
z
i
j
x_i=\sum_jx_jz_{ij}
xi=∑jxjzij,
s
.
t
.
z
i
j
≥
0.
s.t.zij \geq0.
s.t.zij≥0.其中重构系数
z
i
j
z_{ij}
zij表现得像
x
i
x_i
xi和
x
j
x_j
xj的相似度。
基于上述公式,在框架(2)下开发了一系列SC方法,
其中
α
>
0
\alpha>0
α>0是权衡参数