算法——机器学习——无监督学习—— K均值(K-means)图解动画

最新推荐文章于 2024-07-19 08:15:00 发布

谷禾水

最新推荐文章于 2024-07-19 08:15:00 发布

阅读量1.8k

点赞数 3

分类专栏：机器学习数据结构和算法

本文链接：https://blog.csdn.net/ww753951/article/details/119561699

版权

数据结构和算法同时被 2 个专栏收录

10 篇文章 1 订阅

订阅专栏

机器学习

4 篇文章 0 订阅

订阅专栏

本文详细介绍了K均值聚类算法的工作原理和过程，包括随机选取初始聚类中心，计算数据点与聚类中心的距离，以及聚类中心的移动更新。通过示例解释了如何进行聚类和调整聚类中心，直至满足终止条件。同时提供了一个在线动画网站以直观展示算法动态过程。

摘要由CSDN通过智能技术生成

简介

k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有（或最小数目）对象被重新分配给不同的聚类，没有（或最小数目）聚类中心再发生变化，误差平方和局部最小。

文章中使用的动画网站地址，限 pc: k-means算法动画
http://www.donghuasuanfa.com/platform/portal?pc=k-means

算法过程

        算法目的是将数据分类。将相似的数据点分为一组。算法大致分为两个步骤：
        一：聚类：先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离，把每个数据点分配给距离它最近的聚类中心。
        二：聚类中心移动：计算所有归属此聚类中心的数据点的中心位置，然后将聚类中心向中心点靠近。

算法过程详解

示例：图1-1的中心位置的三个方框为聚类中心。屏幕上各个圆点为待分类的数据点。算法的目的是将图中相似的圆点进行聚类。请添加图片描述

图1-1

一:聚类

        先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离，把每个数据点分配给距离它最近的聚类中心。
        示例：计算图中的每个圆点和聚类中心的距离，然后比较圆点和各个聚类中心的距离。将圆点染色为与各个聚类中心距离最短的颜色。
        图1-1中左上角的圆点和图中中心的三个聚类中心计算距离。由于左上角的圆点与红色的聚类中心较近，所以将左上角的圆点染色为红色。

请添加图片描述

图1-2

二:聚类中心移动

二：聚类中心移动：计算所有归属此聚类中心的数据点的中心位置，然后将聚类中心向中心点靠近。
示例：如图1-3。计算所有被染为红色的圆点的中心点位置，然后将红色聚类中心移动到此位置。
请添加图片描述

图1-3

算法结束

k-means算法重复上述一、二步骤。直到当没有（或最小数目）对象被重新分配给不同的聚类，则此次分类步骤结束。整体算法结束。

谷禾水

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
算法——机器学习——无监督学习—— K均值(K-means)图解动画

快速排序简介代码示例排序过程时间复杂度最差时间复杂度最优时间复杂度 && 平均时间复杂度空间复杂度稳定性简介        k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表
复制链接

扫一扫

专栏目录