机器学习算法——Kmeans

最新推荐文章于 2024-08-03 13:57:10 发布

仰望夏日

最新推荐文章于 2024-08-03 13:57:10 发布

阅读量1.3k

点赞数

文章标签：机器学习聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49717022/article/details/119751621

版权

本文详细介绍了K-means聚类算法的原理，包括选择初始簇心，计算样本点到簇核心的距离，以及如何迭代更新簇核心。此外，还探讨了聚类算法与分类算法的区别，并讨论了K-means效果的衡量标准，如肘方法和轮廓系数，以确定最佳的K值和评估聚类质量。

摘要由CSDN通过智能技术生成

1.k-mean算法的原理

1、选取K个点做为初始聚集的簇心

2、分别计算每个样本点到K个簇核心的距离（这里的距离一般取欧氏距离或余弦距离)，找到离该点最近的簇核心，将它归属到对应的簇

3、所有点都归属到簇之后，M个点就分为了K个簇。之后重新计算每个簇的重心（平均距离中心)，将其定为新的“簇核心”;

4、反复迭代2-3步骤，直到达到某个中止条件。
直到质心不再改变

2.聚类算法

聚类算法：是一种典型的无监督学习算法，主要用于将相似的样本自动归到一个类别中。

聚类算法与分类算法最大的区别是：聚类算法是无监督的学习算法，而分类算法属于监督的学习算法，分类是知道结果的。

在聚类算法中根据样本之间的相似性，将样本划分到不同的类别中，对于不同的相似度计算方法，会得到不同的聚类结果，常用的相似度计算方法有欧式距离法。

3.kmeans算法效果衡量标准

3.1 K值确定：

Elbow method就是“肘”方法，对于n个点的数据集，迭代计算k from 1 to n，每次聚类完成后计算每个点到其所属的簇中心的距离的平方和，可以想象到这个平方和是会逐渐变小的，直到k==n时平方和为0，因为每个点都是它所在的簇中心本身。但是在这个平方和变化过程中，会出现一个拐点也即“肘”点，下图可以看到下降率突然变缓时即认为是最佳的k值。

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。