传统K-Means算法流程

最新推荐文章于 2023-08-01 17:13:06 发布

数学那些事

最新推荐文章于 2023-08-01 17:13:06 发布

阅读量2.3k

点赞数

分类专栏：机器学习与深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jamesaonier/article/details/88197162

版权

机器学习与深度学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

1）对于K-Means算法，首先要注意的是k值的选择，一般来说，我们会根据对数据的先验经验选择一个合适的k值，如果没有什么先验知识，则可以通过交叉验证选择一个合适的k值。

2）在确定了k的个数后，我们需要选择k个初始化的质心，就像上图b中的随机质心。由于我们是启发式方法，k个初始化的质心的位置选择对最后的聚类结果和运行时间都有很大的影响，因此需要选择合适的k个质心，最好这些质心不能太近。

好了，现在我们来总结下传统的K-Means算法流程。

输入是样本集D={x1,x2,…xm},聚类的簇树k,最大迭代次数N

输出是簇划分C={C1,C2,…Ck}

1) 从数据集D中随机选择k个样本作为初始的k个质心向量： {μ1,μ2,…,μk}
　　　　2）对于n=1,2,…,N

a) 将簇划分C初始化为Ct=∅t=1,2…k
　　　　　　b) 对于i=1,2…m,计算样本xi和各个质心向量μj(j=1,2,…k)的距离：dij=||xi−μj||22，将xi标记最小的为dij所对应的类别λi。此时更新Cλi=Cλi∪{xi}
　　　　　　c) 对于j=1,2,…,k,对Cj中所有的样本点重新计算新的质心μj=1|Cj|∑x∈Cjx
　　　　　　e) 如果所有的k个质心向量都没有发生变化，则转到步骤3）

3）输出簇划分C={C1,C2,…Ck}

数学那些事

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

数学那些事 CSDN认证博客专家 CSDN认证企业博客

码龄8年

139: 原创

5万+: 周排名

177万+: 总排名

25万+: 访问

: 等级

3821: 积分

98: 粉丝

130: 获赞

51: 评论

486: 收藏

私信

关注

热门文章

分类专栏

最新评论

积分下载互助
大树code: 感谢大佬，帮忙下载一下https://download.csdn.net/download/dashuchengtian/89484431 不用发邮箱，谢谢！
鲁棒性
小小小猿呀: 区别有点像生物里的，抵抗力稳定性和恢复力稳定性
windows7旗舰版正版已激活，但桌面右下角显示windows7 内部版本7601，此windows副本不是正版，求助如何解决？？
挪威旅鼠: 我是更新系统后提示的，用楼主这个办法也不行，最后只能还原解决～
winrm协议python远程执行windows命令报错
WorldWelcome: 1)首先，按照这个https://jingyan.baidu.com/article/25648fc166e6959190fd0056.html，把windows的缺省的“公用网络”改成“专用网络” 2）按这个里面，设置winrm服务，其中的：winrm set winrm/config/service @{AllowUnencrypted="true"}，一定要运行成功。
小生境技术
weixin_49860874: 多目标优化入门，太实用了！！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。