10-1 K-means聚类算法

最新推荐文章于 2023-04-25 21:52:52 发布

工程网络阿sir

最新推荐文章于 2023-04-25 21:52:52 发布

阅读量391

点赞数

文章标签：聚类算法 kmeans

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57332527/article/details/122825607

版权

K-means聚类的算法流程：

一、指定需要划分的簇[cù]的个数K值（类的个数）;

二、随机地选择K个数据对象作为初始的聚类中心（不一定要是我们的样本点）;

三、计算其余的各个数据对象到这K个初始聚类中心的距离，把数据对象划归到距离它最近的那个中心所处在的簇类中;

四、调整新类并且重新计算出新类的中心;

五、循环步骤三和四，看中心是否收敛（不变），如果收敛或达到迭代次数则停止循环;

六、结束

优点：

（1）算法简单、快速。（2）对处理大数据集，该算法是相对高效率的。

缺点：

（1）要求用户必须事先给出要生成的簇的数目K。（2）对初值敏感。（3）对于孤立点数据敏感。

K‐means++算法可解决2和3这两个缺点

k-means++算法选择初始聚类中心的基本原则是：初始的聚类中心之间的相互距离要尽可能的远

步骤一：随机选取一个样本作为第一个聚类中心；

步骤二：计算每个样本与当前已有聚类中心的最短距离（即与最近一个聚类中心的距离），这个值越大，表示被选取作为聚类中心的概率较大；最后，用轮盘法（依据概率大小来进行抽选）选出下一个聚类中心；

步骤三：重复步骤二，直到选出K个聚类中心。选出初始点后，就继续使用标准的K-means算法了。

具体使用spss实现，--------分析-分类-kmeans分类

工程网络阿sir

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
10-1 K-means聚类算法

K-means聚类的算法流程：一、指定需要划分的簇[cù]的个数K值（类的个数）;二、随机地选择K个数据对象作为初始的聚类中心（不一定要是我们的样本点）;三、计算其余的各个数据对象到这K个初始聚类中心的距离，把数据对象划归到距离它最近的那个中心所处在的簇类中;四、调整新类并且重新计算出新类的中心;五、循环步骤三和四，看中心是否收敛（不变），如果收敛或达到迭代次数则停止循环;六、结束优点：（1）算法简单、快速。（2）对处理大数据集，该算法是相对高效率的。缺点：
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。