聚类算法

最新推荐文章于 2022-08-15 15:49:53 发布

leon东

最新推荐文章于 2022-08-15 15:49:53 发布

阅读量503

点赞数

分类专栏：机器学习文章标签： K-means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37812673/article/details/103368830

版权

本文详细介绍了K-means聚类算法的工作原理、实现流程和评估标准，包括误差平方和、轮廓系数和CH系数。同时，讨论了算法的优缺点，如对离群点敏感和依赖初始值。此外，还提到了特征降维的重要性，如皮尔逊和斯皮尔曼相关系数，以及主成分分析在数据压缩和降维中的应用。

摘要由CSDN通过智能技术生成

聚类：

分类算法回归算法属于监督学习

非监督学习（无监督学习）
数据集合：没有目标值

聚类算法：

特征值
根据样本的相似度，把样本聚成簇
使用不同的聚类准则（相似度指标），产生的聚类结果不同。

应用：
用户画像

图像分割（图像的RDB三元素不同来对图像进行聚类）

聚类算法api初步使用：
kmeans算法 k平均聚类算法

sklearn.cluster.KMeans(n_clusters=8)
.fit(x) --> 先去拿咱们所有的数据去根据相似度聚类
.predict(x) --> 然后在根据训练的结果得知聚类的结果
.fit_predict(x) --> 由于咱们的参数一致，则合并的偷懒方法

聚类算法实现流程

k-means 算法
k：打算聚成的簇数（中心质点的数目）
means：同一簇中的所有点到中心质点的距离的平均值（越小越好）

k-means聚类步骤：

1 样本之中随机选k个点当作是中心质点（k：聚类的簇数）
2 其他的所有点计算离哪个中心点近，就是这个中心点所代表的这一簇
3 根据每一簇的样本求出新的中心点
4 第2步第3步重复迭代，直到中心点不动为止（达到完美的聚类效果）

###模型评估
1 误差平方和

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
聚类算法

聚类：分类算法回归算法属于监督学习非监督学习（无监督学习）数据集合：没有目标值聚类算法：特征值根据样本的相似度，把样本聚成簇使用不同的聚类准则（相似度指标），产生的聚类结果不同。应用：用户画像图像分割（图像的RDB三元素不同来对图像进行聚类）聚类算法api初步使用：kmeans算法 k平均聚类算法sklearn.cluster.KMeans(n_clusters=8)...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。