快速理解K-means聚类算法

最新推荐文章于 2022-08-05 21:28:21 发布

CrystalheartLi

最新推荐文章于 2022-08-05 21:28:21 发布

阅读量385

点赞数

分类专栏：统计机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43220532/article/details/109174914

版权

统计机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1，简述：算法接受参数K，然后将事先输入的n个数据对象划分为K个聚类并满足：同一个聚类中的对象相似度较高；而不同类中的对象相似度较小。
2，算法思想：以空间中K个点为中心进行聚类，某个数据对象最靠近哪一类，就将这个数据归为哪一类，并通过迭代的方法，逐次更新各聚类中心的值，直到得到符合预期的聚类结果。
3，算法描述：
a，适当选择K个类的初始中心；
b，在每次迭代中，对任一一个样本，求其到k各中心的距离，将该样本归到距离最短的中心所在的类；
c，利用求均值方法更新每个类的中心值；
d，对于所有的K个聚类中心，如果利用b，c的迭代法更新后，如果中心值保持不变，或者中心值的变化小于设定的阈值，则迭代结束，否则继续迭代。
4，算法流程：
输入数据：K，data[n]
a，选择K个初始中心点，例如K[0]=data[0]，… , K[k-1]=data[k-1];
b，对于data[0]，… ，data[n-1]分别与K[0]，… ，K[k-1]比较，假定与K[i]差值最少，就将数据标记为i类；
c，对于所有标记为i类的点，重新计算K[i]=(所有标记为i的data[i]之和/标记为i的个数)；
d，重复b，c，直到所有K[i]值不变或者小于设定的阈值。
5，优点：速度快，简单
缺点：最终结果跟初始点选择相关，容易陷入局部最优，并且需要事先知道聚类个数K值

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
快速理解K-means聚类算法

12345欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：全新的界面设计，将会带来全新的写作体验；在创作中心设置你喜爱的代码高亮样式，Markdown 将代码片显示选择的高亮样式进行
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

CrystalheartLi 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。