Kmeans聚类③——Kmeans聚类原理&轮廓系数&Sklearn实现

最新推荐文章于 2024-08-17 09:20:14 发布

数据小斑马

最新推荐文章于 2024-08-17 09:20:14 发布

阅读量2.1w

点赞数 16

分类专栏： Kmeans 文章标签： Kmeans原理 keans聚类评判标准轮廓系数 Kmeans sklearn实现 Kmeans范例

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cindy407/article/details/92063986

版权

本文介绍了KMeans聚类的基本原理，包括数据向量化、聚类中心的选择和迭代过程。讨论了KMeans的评判标准，如霍普金斯统计量、肘部法则和轮廓系数，并探讨了为何在推荐系统中常使用余弦相似度。此外，还阐述了在Sklearn库中实现KMeans的主要参数和应用实例，强调了CH分数在多维特征聚类评估中的作用。

摘要由CSDN通过智能技术生成

数据分析目录（文末有超级彩蛋！）：
一、Excel系列——四大常用函数及十大高级图表
 二、SQL系列——性能优化/多表关联/窗口分析函数等
 三、统计学系列——概率论/置信区间/相关/抽样等
 四、Pandas系列——数据读取/清洗/规整/分析实战等
 五、Python做图系列——箱型图/散点图/回归图/热力图等
 六、业务积累系列——流水预测/精细化运营/排序算法等
 七、Kmeans系列——原理/评价指标/RFM实战等
 八、决策树系列——算法原理/调参/python实现/项目实战
 九、贝叶斯系列——算法原理/3种模型/文本分类实战
 十、神经网络系列——BP算法原理/最小二乘法/项目实战

Kmeans是我接触的第一个机器学习算法，原理简单，却很实用，只要一想到聚类，基本上没有Kmeans解决不了的问题（此处略有夸张~~），本篇整理了Kmeans聚类原理，评判标准以及Sklearn实现过程（文末有大礼赠送）

一、Kmeans聚类原理

用大白话来说，Kmeans分为三步：

1、待分类的样本向量化，投射到坐标轴上，先定分几个类（假设3类），随

最低0.47元/天解锁文章

数据小斑马

关注

16
点赞
踩
167

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。