谱聚类的定义
是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图,使子图内部尽量相似,而子图间距离尽量距离较远,以达到常见的聚类的目的。
- 矩阵的谱: 方阵作为线性算子,它的所有特征值的全体称为方阵的谱,非方阵( ATA )的特征值
- 谱半径: (A^TA)的最大特征值
- 谱聚类: 对样本数据的拉普拉斯矩阵的特征值进行聚类
- 拉普拉斯矩阵: L=D-W
基本算法(随机游走的拉普拉斯矩阵)
- 计算 n∗n 的相似度矩阵W和度矩阵D
- 计算正则的拉普拉斯矩阵 Lrw=D−1(D−W)
- 计算 Lrw 的前k个特征向量 u1,⋯,uk (前k个小的)
- 将k个特征向量组成矩阵U
- 令 yi∈Rk 是U的第i行的向量
- 使用 k−means 将点 (yi)1,2...,n 聚成簇c1,…ck
- 输出A1,…AK
- 图的最小割转换为拉普拉斯矩阵
f′Lf=12∑wij(fi−fj)2