聚类分析之谱聚类

最新推荐文章于 2022-02-18 21:13:01 发布

weixin_34377919

最新推荐文章于 2022-02-18 21:13:01 发布

阅读量331

点赞数

文章标签：人工智能 python

原文链接：http://www.cnblogs.com/zhangtaosx/p/7390911.html

版权

聚类根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量，然后选择合适的特征向量聚类不同的数据点。

谱聚类可以在任意形状的样本空间聚类，且收敛于全局最优解，因此在处理高维数据方面存在着明显优势。总的来说，该算法存在一些不足之处。算法在聚类之前需要设置具体应用的尺度参数，通常需要一些经验。初始聚类中心对整个聚类效果影响很大，存在初始值敏感问题。很难找到图划分的优化解，聚类数目对于整个聚类效果有很大影响。

setp1:计算图的拉普拉斯矩阵L=D-w

setp2:归一化拉普拉斯矩阵

setp3:计算归一化后的拉普拉斯矩阵的特征值和特征向量Q

setp4:对Q进行K-means聚类，return(c1,c2,c3...cn)

优点：因此比传统的聚类算法更加健壮一些，对于不规则的误差数据不是那么敏感，计算复杂度比 K-means 要小

代码：

from sklearn.cluster import SpectralClustering
from sklearn import datasets
from dask.array.learn import predict
import numpy as np
iris = datasets.load_iris()
X = iris.data
y = iris.target
print(y)
clf=SpectralClustering(n_clusters=3)
predicted=clf.fit_predict(X)
print(predicted)
k2y = np.array([0,1,2])
print(k2y[predicted])
print((k2y[predicted] == y).astype(int).mean())

聚类精度为0.9

转载于:https://www.cnblogs.com/zhangtaosx/p/7390911.html

weixin_34377919

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
聚类分析之谱聚类

聚类根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量，然后选择合适的特征向量聚类不同的数据点。谱聚类可以在任意形状的样本空间聚类，且收敛于全局最优解，因此在处理高维数据方面存在着明显优势。总的来说，该算法存在一些不足之处。算法在聚类之前需要设置具体应用的尺度参数，通常需要一些经验。初始聚类中心对整个聚类效果影响很大，存在初始值敏感问题。很...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。