原文:One-pass Multi-view Clustering for Large-scale Data
创新点:
传统的 N M F NMF NMF聚类分两步走:求得 H H H矩阵,将 H H H矩阵用于 k m e a n s kmeans kmeans。这篇文章将两步合为了一步走。
目标函数
首先是标准的多视图 N M F NMF NMF。这里加了给 W W W做了一个正交化,这样可以给H的特征进行一个重构,特征之间的线性关系会越弱,特征之间就分得更开,聚类效果就越好。
注意!
这里
H
H
H的特征纬度不再是以往一样,需要自己定一个超参数,而是直接定为簇数
k
k
k。
接来下是 k m e a n s kmeans kmeans的矩阵形态写法:
Y
∈
R
n
∗
k
Y\in R^{n*k}
Y∈Rn∗k,也就是隶属度。因为是
k
m
e
a
n
s
kmeans
kmeans,硬聚类,所以
Y
Y
Y的每一个行向量肯定只能有一个“1”,如果是FCM,就不会有这个约束限制。C是中心矩阵,每一个行向量就代表了一个中心。
如果
H
H
H和
Y
C
YC
YC注定相似的话,那干脆直接将他们相等好了。作者就简单粗暴地让
将该式带入上面的目标函数得:
把隶属度Y全局化,再将每个视图相加得到最终的目标函数:
这里他直接把每个视图的权重设置为了一样,说是实验表明,这种等权重方式比多权重方式效果更好。