Python机器学习之聚类

最新推荐文章于 2023-04-24 21:01:29 发布

唱戏先生

最新推荐文章于 2023-04-24 21:01:29 发布

阅读量198

点赞数

分类专栏： python之机器学习文章标签： Python机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43131852/article/details/94440416

版权

本文介绍了Python机器学习中的K-means算法，详细阐述了算法的处理过程，并通过全国31个省份城镇居民消费数据的实例，展示了如何使用sklearn库进行聚类操作。通过对数据预处理、调用KMeans方法并计算聚类标签和平均消费，揭示了K-means在实际问题中的应用。

摘要由CSDN通过智能技术生成

Python机器学习笔记

K-means算法

k-means算法以k为参数，把n个对象分成k个簇，使簇内具有较高的相似度，而簇间的相似度较低。
其处理过程如下：
1.随机选择k个点作为初始的聚类中心；
2.对于剩下的点，根据其与聚类中心的距离，将其归入最近的簇
3.对每个簇，计算所有点的均值作为新的聚类中心
4.重复2、3直到聚类中心不再发生改变
在这里插入图片描述

具体实例

素材提取：
https://pan.baidu.com/s/1VIbeRVWODEQ21UNFnptznA
密码：hr8v

现有1999年全国31个省份城镇居民家庭平均每人全年消费性支出的八个主要变量数据，这八个变量分别是：食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住以及杂项商品和服务。利用已有数据，对31个省份进行聚类。

首先建立工程，导入sklearn相关文件包； NumPy是Python语言的一个扩充程序库，支持高级大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。使用sklearn.cluster.KMeans可以调用K-means算法进行聚类。

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python机器学习之聚类

Python机器学习笔记K-means算法k-means算法以k为参数，把n个对象分成k个簇，使簇内具有较高的相似度，而簇间的相似度较低。其处理过程如下：1.随机选择k个点作为初始的聚类中心；2.对于剩下的点，根据其与聚类中心的距离，将其归入最近的簇3.对每个簇，计算所有点的均值作为新的聚类中心4.重复2、3直到聚类中心不再发生改变具体实例现有1999年全国31个省份城镇居民...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

唱戏先生 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。