【机器学习算法基础】（基础机器学习课程）-11-k-means-笔记

郭十六弟

于 2024-08-04 16:26:12 发布

阅读量209

点赞数 7

文章标签： kmeans 笔记算法

本文链接：https://blog.csdn.net/g1997c/article/details/140906493

版权

为了更好地理解 K-Means 算法，下面通过一个简单的案例进行说明。

假设我们有以下 10 个二维数据点，表示不同商店的销售额（单位：千元）和顾客数（单位：人）：

[(10, 100), (20, 80), (30, 70), (40, 60), (50, 50), (60, 40), (70, 30), (80, 20), (90, 10), (100, 5)]

我们希望将这些商店分成 2 个簇（K=2）。

选择 K 值：K=2。
初始化簇中心：随机选择两个初始簇中心。假设我们选择 (10, 100) 和 (100, 5)。
分配数据点：
- 计算每个数据点到 (10, 100) 和 (100, 5) 的距离。
- 将每个数据点分配给最近的簇中心。
- 例如，(10, 100) 距离 (10, 100) 为 0，距离 (100, 5) 为 126.49，所以它属于第一个簇。
更新簇中心：
- 计算每个簇的新中心。
- 例如，假设第一个簇包含 (10, 100), (20, 80), (30, 70)，新中心是这三个点的均值：(20, 83.33)。
重复分配数据点和更新簇中心：
- 不断重复上面的步骤，直到簇中心不再变化。

最终，我们可能得到如下两个簇：

每个簇中心分别为 (30, 72) 和 (80, 21)。

优点：

缺点：

K-Means 聚类算法通过迭代地分配数据点和更新簇中心，将数据集划分成 K 个簇。尽管有一些局限性，但由于其简单性和高效性，K-Means 广泛应用于各种聚类任务。

关注