kmeans算法中的sse_kmeans聚类理论篇

最新推荐文章于 2024-01-19 20:49:02 发布

全自動資本主義

最新推荐文章于 2024-01-19 20:49:02 发布

阅读量2.3k

点赞数 1

文章标签： kmeans算法中的sse

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35242442/article/details/111906069

版权

本文深入探讨kmeans聚类算法，解释其原理、时间复杂度和空间复杂度。重点讨论SSE（均方误差平方和）在算法收敛过程中的作用，以及如何通过0-1规格化处理数据。同时，介绍了轮廓系数作为评估聚类效果的指标，并提供了K值选择的策略，包括实际应用中的R语言实现示例。

摘要由CSDN通过智能技术生成

前言

kmeans是最简单的聚类算法之一，但是运用十分广泛。最近在工作中也经常遇到这个算法。kmeans一般在数据分析前期使用，选取适当的k，将数据分类后，然后分类研究不同聚类下数据的特点。

本文记录学习kmeans算法相关的内容，包括算法原理，收敛性，效果评估聚，最后带上R语言的例子，作为备忘。

算法原理

kmeans的计算方法如下：

1 随机选取k个中心点

2 遍历所有数据，将每个数据划分到最近的中心点中

3 计算每个聚类的平均值，并作为新的中心点

4 重复2-3，直到这k个中线点不再变化(收敛了)，或执行了足够多的迭代

时间复杂度：O(I*n*k*m)

空间复杂度：O(n*m)

其中m为每个元素字段个数，n为数据量，I为跌打个数。一般I,k,m均可认为是常量，所以时间和空间复杂度可以简化为O(n)，即线性的。

算法收敛

从kmeans的算法可以发现，SSE其实是一个严格的坐标下降(Coordinate Decendet)过程。设目标函数SSE如下：

SSE(,,…,) =

采用欧式距离作为变量之间的聚类函数。每次朝一个变量的方向找到最优解，也就是求偏倒数，然后等于0，可得

最低0.47元/天解锁文章

全自動資本主義

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。