谱旋转--spectral rotation

最新推荐文章于 2022-10-04 20:49:07 发布

Bear_Kai

最新推荐文章于 2022-10-04 20:49:07 发布

阅读量2.6k

点赞数

分类专栏：机器学习文章标签：算法

本文链接：https://blog.csdn.net/Bear_Kai/article/details/78585115

版权

机器学习专栏收录该内容

13 篇文章 2 订阅

订阅专栏

谱聚类算法分两步进行，第一步可以看做是把原始数据投影到一个新的（低维）空间，第二步在新的空间中对数据进行处理得到最终聚类结果。第二步常采用的方法有Kmeans，这里介绍另外一种方式：谱旋转（spectral rotation）。关于谱聚类的详细介绍可参见这篇博客。

谱聚类第一步中求解的目标式可表述为：

min F \in R n \times k T r (F T L F) s . t . F T F = I k .

$\begin{equation} \min_{F\in \mathbb{R}^{n\times k}} Tr(F^T L F) \quad s.t. \quad F^T F=I_k. \end{equation}$ 上式中，

F $F$ 称作指示矩阵（indicator matrix），它的第i行可以看做是第i个数据的低维嵌入表示。常见的是利用kmeans对这些低维表示向量进行聚类得到簇标签。假定

F∗ $F^*$ 是上式的最优解，我们可以发现，对于任意的正交阵

R $R$ ，

F∗R $F^*R$ 也是上式的最优解。

给定Y是n*c大小的标签矩阵（0,1取值），理想的F是离散的，每一行只有一个非零元，且可以这样表示： $F=Y(Y^TY)^{-1/2}=f(Y)$ 。于是F满足的约束是： $F>=0$ ， $F^TF=I_k$ 。为了求解的方便，F被松弛为连续取值（即忽略掉了非负约束），上面的目标式也是这样来的。那我们可以再定义了一个映射 $f^{-1}$ ，由指示矩阵到标签矩阵： $Y^*=f^{-1}(F^*)=diag(F^*F^{*T})^{-1/2}F^*$ ，这里diag(M)表示一个对角矩阵，对角元跟M的对角元一样。同样可以验证， $f^{-1}(F^*R)=Y^*R$ 。

现在的目标就是要根据松弛后的指示矩阵F*，尽可能准确的获取簇标签矩阵Y，即让F*对应的Y*R尽可能接近Y，注意这里除了Y未知，还需要挑选一个合适的R，即有两个优化变量，公式化表述就是：

min Y \in R n \times k, R \in R k \times k ∥ Y - Y * R ∥ 2 F s . t . R T R = I k, Y 1 k = 1 n .

$\begin{equation} \min_{Y\in \mathbb{R}^{n\times k}, R\in \mathbb{R}^{k\times k}} \|Y-Y^*R\|_F^2 \quad s.t. \quad R^T R=I_k , Y\mathbf{1}_k=\mathbf{1}_n. \end{equation}$ 这里

1k $\mathbf{1}_k$ 是一个元素全为1的k维向量。

可采用交替优化的方式来求解上式：
1. 固定R，求Y : 非极大抑制（non-maximum suppression）
2. 固定Y，求R : SVD分解

ref:
[1] Yu, Stella X., and J. Shi. “Multiclass Spectral Clustering.” ICCV 2003.
[2] Nie, Feiping, et al. “Spectral embedded clustering.” IJCAI 2009.