2.k-均值（k-means）聚类算法

最新推荐文章于 2024-04-02 16:17:10 发布

VIP文章 bgm_Amber

最新推荐文章于 2024-04-02 16:17:10 发布

阅读量2.8k

点赞数

分类专栏：数据分析学习文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bgm_Amber/article/details/128061090

版权

简介：K-均值聚类算法时最基础、应用最广泛的聚类算法，也是最快速的聚类算法之一。

一.原理和过程

原理：K-均值聚类算法以最小化误差函数为目标将样本数据集分为k类。

过程：

设定k个类别的中心的初值；
计算每个样本到k个中心点的距离，按最近距离进行分类；
以每个类别中样本的均值，更新该类别的中心；
重复迭代以上步骤，直到达到终止条件（迭代次数、最小平方误差、簇中心点变化率）

优缺点：优点是原理简单、算法简单，速度快，聚类效果极好，对大数据集具有很好的伸缩性。这些优点特别有利于初学者、常见问题。其缺点是需要给定 K值，对一些特殊情况（如非凸簇、特殊值、簇的大小差别大）的性能不太好。

二.Sklearn中K-均值算法的使用

sklearn.cluster.KMeans 类是 K-均值算法的具体实现。

1.KMeans 的主要参数

n_clusters: int,default=8　　K值，给定的分类数量，默认值 8。
init：{‘k-means++’, ‘random’}　　初始中心的选择方式，默认'K-means++'是优化值，也

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
2.k-均值（k-means）聚类算法

2.k-均值（k-means）聚类算法
复制链接

扫一扫

专栏目录

bgm_Amber CSDN认证博客专家 CSDN认证企业博客

码龄2年

11: 原创

77万+: 周排名

159万+: 总排名

6886: 访问

: 等级

113: 积分

5: 粉丝

0: 获赞

3: 评论

20: 收藏

私信

关注

热门文章

分类专栏

最新评论

2.k-均值（k-means）聚类算法
2301_78297281: 大佬，能不能给我数据集
2.k-均值（k-means）聚类算法
get嘤嘤嘤: 文章内容丰富，条理清晰，值得一波关注，如沐春风，配图也很有趣，希望作者也指点我一番！🍒🍒🍒🍒∠(｀ω´*)敬礼✌(̿▀̿ ̿Ĺ̯̿̿▀̿ ̿)✌

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。