<机器学习笔记-06 ><scikit-learn 06>K-Means 聚类

最新推荐文章于 2024-05-28 00:15:00 发布

赵鹏举

最新推荐文章于 2024-05-28 00:15:00 发布

阅读量1w

点赞数 2

分类专栏：机器学习 machine learning 文章标签： python 机器学习聚类 k-means 肘部法则

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_25040013/article/details/52574962

版权

本文深入探讨了聚类算法中的K-Means方法，包括聚类概念、K-Means的实现过程、肘部法则确定K值以及如何使用Python的scikit-learn库进行聚类分析。此外，还介绍了成本函数、轮廓系数等评估指标，提供了Python代码示例。

摘要由CSDN通过智能技术生成

<机器学习笔记-06>(scikit-learn 06)K-means聚类

关键词：聚类，K-means，scikit-learn，python

摘要：本文主要介绍聚类、K-means的概念和结果评估，以及使用python进行聚类分析的方法；

要点总结
1. 了解无监督学习以及聚类概念；
2. K-means的实现过程，肘部法则确定超参数K，利用平均畸变程度和轮廓系数评估聚类效果；
基本概念
1. 聚类（clustering）
  1. 属于无监督学习，可以找出不带标签数据的相似性的算法；
  2. 概念：将更具相似性的样本归为一类（cluster），同组中的样本比其他租的样本更相似；
  3. 应用：市场调查中对用户分组、社交网络识别社区、推荐系统、寻找相似模式的基因组；
2. K-means聚类算法
  1. 实现过程：
    1. 指定聚类的数量 $K$
    2. 初始化，指定第 $k$ 个类的重心位置 $u_k$ ；（实际中，为避免局部最优解，需要从不同位置开始初始化，取最小成本函数对应的重心位置作为初始化位置）
    3. 遍历每一个元素 $x_i$ ，计算该元素到各个类重心 uk

最低0.47元/天解锁文章

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。