K-means 算法【基本概念篇】

最新推荐文章于 2024-08-27 22:15:09 发布

君的名字

最新推荐文章于 2024-08-27 22:15:09 发布

阅读量2.6w

点赞数 72

分类专栏：【机器学习】

本文链接：https://blog.csdn.net/chichoxian/article/details/84075128

版权

K-means算法是一种无监督学习的聚类算法，用于将数据点按距离分配到预设数量的类别。文章介绍了算法的基本步骤，包括随机选择初始中心点，计算点与中心的距离并重新分配类别，以及不断迭代直至中心点不变。讨论了中心点选择对结果的影响，并以二维坐标为例展示了迭代过程。

摘要由CSDN通过智能技术生成

写在前面的话

k-means 算法是一个聚类的算法也就是clustering 算法。是属于无监督学习算法，也是就样本没有label(标签)的算分，然后根据某种规则进行“分割”，把相同的或者相近的objects 物体放在一起。

在这里K就是我们想要分割的的聚类的个数。

当然了，很多资料都会说这个算法吧，毕竟简单粗暴可依赖

首先我们有以下的几个点

这个算法不能帮助我们自动分类，所以我们需要指定我们需要的个数。其实在很多实际应用当中，我们很难知道我们的数据是什么分布的，应该分成几类比较好。这也是k-means自身的一个缺陷，所以不能帮助我们自动的聚类。

注：如果我在本文中说了分类，其实是分割的意思，我想表达的意思是聚类。
中文和英文切换，在意思上表达真的有点差距。<

关注

专栏目录