＜机器学习＞ K-means

最新推荐文章于 2024-08-02 17:15:32 发布

thisiszdy

最新推荐文章于 2024-08-02 17:15:32 发布

阅读量175

点赞数 4

分类专栏：机器学习文章标签：机器学习 kmeans

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/thisiszdy/article/details/133180606

版权

机器学习专栏收录该内容

9 篇文章 1 订阅

订阅专栏

K-means定义

K-means 是一种广泛使用的聚类算法，旨在将数据集中的点分组为 K 个簇（cluster），使得每个簇内的点尽可能相似，而不同簇的点尽可能不同。K-means 算法通过迭代的方式，逐步优化簇的分配和簇的中心点位置，以达到上述目标。

K-means 算法的基本步骤

选择簇的数量 K：首先，需要确定将数据分成多少个簇。这个值通常是基于数据集的先验知识或通过一些启发式方法（如肘部法则）来确定的。
初始化簇中心：随机选择 K 个数据点作为初始的簇中心。
分配簇：对于数据集中的每一个点，计算它到 K 个簇中心的距离（常用欧氏距离），并将该点分配到距离它最近的簇中心所对应的簇中。
更新簇中心：对于每一个簇，重新计算簇内所有点的均值（或质心），并将该均值作为新的簇中心。
重复步骤 3 和 4：不断重复分配簇和更新簇中心的步骤，直到簇中心的变化非常小或达到预设的迭代次数，这时可以认为算法已经收敛。

优点&缺点

优点

简单直观：算法易于理解和实现。
收敛速度快：在大多数情况下，算法能够快速收敛。
适用于大规模数据集：可以处理大量的数据点。

缺点

需要预先指定 K 值：K 值的选择直接影响聚类效果，但选择最佳 K 值往往比较困难。
对初始簇中心敏感：不同的初始簇中心可能导致不同的聚类结果。
可能陷入局部最优：由于采用贪心策略，算法可能只达到局部最优解而非全局最优解。
不适合非球形簇：K-means 假设簇是球形的，对于非球形簇或大小差异很大的簇，效果可能不佳。

关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
＜机器学习＞ K-means

K-Means
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。