python使用k-means算法代码案例-详解K-means算法在Python中的实现

最新推荐文章于 2024-07-09 17:33:15 发布

weixin_37988176

最新推荐文章于 2024-07-09 17:33:15 发布

阅读量2.1k

点赞数

本文介绍了K-means算法的基本概念、工作原理、优缺点，并通过Python的sklearn库展示了K-means的实例代码，包括数据生成、模型训练、结果分析，最后讨论了算法的效率和适用场景。

摘要由CSDN通过智能技术生成

K-means算法简介

K-means是机器学习中一个比较常用的算法，属于无监督学习算法，其常被用于数据的聚类，只需为它指定簇的数量即可自动将数据聚合到多类中，相同簇中的数据相似度较高，不同簇中数据相似度较低。

K-MEANS算法是输入聚类个数k，以及包含 n个数据对象的数据库，输出满足方差最小标准k个聚类的一种算法。k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。

核心思想

通过迭代寻找k个类簇的一种划分方案，使得用这k个类簇的均值来代表相应各类样本时所得的总体误差最小。

k个聚类具有以下特点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。

k-means算法的基础是最小误差平方和准则,K-menas的优缺点：

优点：

原理简单

速度快

对大数据集有比较好的伸缩性

缺点：

需要指定聚类数量K

对异常值敏感

对初始值敏感

K-means的聚类过程

其聚类过程类似于梯度下降算法，建立代价函数并通过迭代使得代价函数值越来越小

适当选择c个类的初始中心；

在第k次迭代中，对任意一个样本，求其到c个中心的距离，将该样本归到距离最短的中心所在的类；

利用均值等方法更新该类的中心值；

对于所有的c个聚类中心，如果利用（2）（3）的迭代法更新后，值保持不变，则迭代结束，否则继续迭代。

最低0.47元/天解锁文章

weixin_37988176

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python使用k-means算法代码案例-详解K-means算法在Python中的实现

K-means算法简介K-means是机器学习中一个比较常用的算法，属于无监督学习算法，其常被用于数据的聚类，只需为它指定簇的数量即可自动将数据聚合到多类中，相同簇中的数据相似度较高，不同簇中数据相似度较低。K-MEANS算法是输入聚类个数k，以及包含 n个数据对象的数据库，输出满足方差最小标准k个聚类的一种算法。k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。