理解谱聚类
前面介绍过K-means聚类方法,这个方法简单易懂,主要在于如何定义距离计算公式(一般使用欧氏距离),如何选择K值,这两个问题。这次我们介绍谱聚类,它是K-means的升级版。我们计划从这样几个方面介绍谱聚类:K-measn聚类有什么缺点?谱聚类的基本思想,以及谱聚类的算法步骤。
那么K-means到底有什么问题呢?我们为什么需要改进它呢~
- 当样本维数增大时,K-means的计算会困难。因为在K-means中,输入计算的是欧氏空间中的原始向量;
- K-means求得的是一种局部最优的聚类策略,SSE不一定就是最小的;
1. 谱聚类的基本思想