整体概述:
- 第一步:降维----特征值
- 第二步:k-means聚类
基于图论的聚类方式:
- 拉普拉斯矩阵的特征向量进行聚类
连点成线构成图:
图的度矩阵-图的邻接矩阵=拉普拉斯矩阵:
归一化拉普拉斯矩阵:
生成该拉普拉斯矩阵最小的k个特征值+特征向量:
特征向量kmeans聚类:
谱聚类的优点与缺点:
- 优点:
- 稀疏处理:
- 只要数据之间的相似度矩阵
- 对于处理稀疏数据的聚类很有效
- 高维处理:
- 使用降维
- 处理高维数据聚类时间复杂度比传统聚类算法好
- 在高维数据上表示尤为明显
- 稀疏处理:
- 缺点:
- k值:
- k值只能靠猜测
- 最终效果可能不同:
- 聚类效果依赖于相似矩阵
- 不同相似矩阵得到最终聚类效果不同
- k值: