Kmeans的改进-kmeans++算法的聚类中心初始点选取和蓄水池采样算法

最新推荐文章于 2022-09-17 08:24:42 发布

着凉的石头

最新推荐文章于 2022-09-17 08:24:42 发布

阅读量8k

点赞数

分类专栏：实践学习聚类算法文章标签：聚类算法 kmeans++ 蓄水池采样

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hotallen/article/details/19247387

版权

Kmeans算法因初始中心点随机选择导致聚类结果不稳定。Kmeans++通过加权的蓄水池采样策略解决这一问题，提高聚类准确性。本文概述了Kmeans++的算法流程，分析其复杂度，并提及蓄水池采样的实际应用。

摘要由CSDN通过智能技术生成

要解决的问题

kmeans算法存在的一个问题是初始中心的选取是随机的，造成聚类的结果也是随机的，一般的做法是进行多次重复整个聚类过程，然后选取聚类效果好的。Kmeans++算法可以很好的解决初始点的选取问题，本文简单进行了总结和实现，代码方面还有很多不完善的地方，仅供参考，欢迎拍砖。

算法流程

a). 首先从数据集中随机选取一个点作为中心点，并加入到中心点集合centers中

b). 对于数据集中的每个点i，都和集合centers中的点进行计算,得到最近距离d[i]，计算完之后得到sum(d[i])

c). 取一个随机值random,使random落在sum(d[i])内，然后random -= d[i] 直到random < 0的时候，这个i即为下一个中心点，将这个点加入到centers中

最低0.47元/天解锁文章

着凉的石头

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。