k-means和二分k-means算法

最新推荐文章于 2024-07-05 23:11:55 发布

waeceo

最新推荐文章于 2024-07-05 23:11:55 发布

阅读量2.4k

点赞数

分类专栏： machine-learn machineLean 文章标签： k-means 二分k-means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/waeceo/article/details/93838552

版权

聚类算法是机器学习中的一类无监督学习方法，用于将无标签的数据进行聚类划分。最简单的也最典型的一类算法就是KMeans算法。此处的K表示划分成K个聚类。利用各个点到质心之间的距离的平方和作为将节点划分到不同类的标准。当然也可以采用其他的距离计算方法，不一定是欧式距离方法。

一、KMeans

此方法一般是在数据分析前期使用，选取适当的K，将数据聚类后，研究不同聚类下数据的特点。

算法原理：

（1）随机选择K个中心点；

（2）在第j次迭代中，对于每个样本点，选取最近的中心点，归为该类；

（3）更新中心点为每类的均值；

（4）j < j-1，重复（2）（3）迭代更新，直到误差小到某个值或者达到一定的迭代步数，误差不变，也就是收敛为止；

空间复杂度为O（n），时间复杂度为O（l*K*N），其中N为样本个数，K为中心点个数，即聚类数，I为迭代次数

为什么迭代后误差逐渐减小：

SSE=

对于而言，

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

waeceo CSDN认证博客专家 CSDN认证企业博客

码龄17年

62: 原创

2万+: 周排名

8677: 总排名

67万+: 访问

: 等级

4499: 积分

393: 粉丝

456: 获赞

130: 评论

1378: 收藏

私信

关注

热门文章

分类专栏

最新评论

go 内存分配管理
2301_77527844: md go ddr idr dr:administratorusernameipdrmd:go indr FF,00 F0,go;
go 内存分配管理
CSDN-Ada助手: Go 技能树或许可以帮到你：https://edu.csdn.net/skill/go?utm_source=AI_act_go
sql查询调优之where条件排序字段以及limit使用索引的奥秘
全栈小5: 感谢博主的分享，又重温了一遍基础知识，加油
张正友标定法的真实理解
被钢琴支配的悲惨大学生: n=3的话，V满秩，b不就是零向量？这个Vb=0有问题吧，应该把两个正交向量模为1的条件也写入方程，这样一幅图片提供三个方程，两张图就能解出A，已经在matlab里实测两张图是可以解出A的
C#与USB设备通信
mushanw: 求源码！！！谢谢。408990512@qq.com

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。