机器学习之聚类分析（一）--- K-means

最新推荐文章于 2023-12-12 20:27:06 发布

qinqinwawa

最新推荐文章于 2023-12-12 20:27:06 发布

阅读量604

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qinqinwawa/article/details/90265831

版权

K-means是无监督学习中的经典算法，用于数据聚类。算法流程包括随机选择初始中心点，计算样本到中心点的距离并进行分类，然后更新中心点直至收敛。其优点包括简单快速，但缺点如k值难确定、易受噪声影响和可能陷入局部最优。K-means++是改进的初始化方式，能更优地选择中心点。软聚类如模糊C-means允许样本同时属于多个簇。

摘要由CSDN通过智能技术生成

推荐：聚类算法视频教程

聚类是无监督学习中最常用的算法。
在机器学习与数据挖掘中，K-Means（（K均值））是一种无监督学习的算法。

1 具体算法流程如下：

（1）随机从样本中选取K个元素，作为k个类别的中心。
（2）分别计算每个样本到k个类别中心的距离，并将这些样本划归到距离最近的类别。即数据点距离哪个中心点最近就分到哪一类中。可以认为距离越近，两者之间越相似。而不同距离的度量其聚类结果不同。各种距离的计算
（3）将每个类别中心更新为隶属该类别的所有样本的均值；
（4）重复2~3步，直到迭代次数达到一定值或者每一类中心点移动小于某个临界值（即认为已经收敛）。

2 K-means的目标函数：
（多次运行K均值，产生的多个不同的簇集，优选SSE最小的。）在这里插入图片描述 <

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。