Definition
spectral clustering techniques make use of thespectrum (eigenvalues) of thesimilarity matrix of the data to performdimensionality reduction before clustering in fewer dimensions. The goal of spectral clustering is to partition the dataset into disjoint subsets with high intra-cluster similarity and low inter-cluster similarity.
由此可见,谱聚类就是一个图分割问题。用无向图 描述 维空间的数据点集 ,,其中每条边关联一个权值,描述点和之间的相似度,则图的邻接矩阵可用相似度矩阵且 表示。
Similarity graph&matrix
在维空间中,用一个相似度函数 描述两点之间的相似度,如用高斯核 计算相似度。相似度矩阵的构建过程就是描述数据点集中各数据点局部邻域关系图的过程,常用的构建方法有:
1. K-Nearest Neighbor
若是的KNN邻接点,则和