k-means++算法：针对K-means算法缺点的针对性改进版本

最新推荐文章于 2024-06-27 08:27:04 发布

Lebron_xueyan

最新推荐文章于 2024-06-27 08:27:04 发布

阅读量2.7k

点赞数 1

分类专栏：算法文章标签：聚类算法机器学习聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZXY115019/article/details/106676070

版权

算法专栏收录该内容

2 篇文章 1 订阅

订阅专栏

在上一篇中我们对k-means算法进行了简单地介绍，明确了k-means算法的优缺点，本章我们将介绍k-means算法的改进版本——k-means++算法，该算法是为解决k-means分类结果会受到初始点的选取而存在区别而提出的。

k-means++算法仅对k-means算法的初始点选择部分进行改进，改进后算法的初始质心选择思路为：

初始聚类中心之间的相互距离要尽可能的远；
假设已经选取了n个初始聚类中心（n < k），则在选取第 n+1 个聚类中心时，距离当前 n 个聚类中心越远的点会有更高的概率被选为第 n+1 个聚类中心

k-means++算法的步骤如下：

随机选择一个样本作为第一个聚类中心 c1;
计算每个样本与当前已有聚类中心的最短距离（即与最近一个聚类中心的距离），用 D（x）表示，这个值越大，表示被选取作为聚类中心的概率就越大；

k-means聚类算法的两个难点：

确定 k 值得大小

k 值的确定

样本聚类误差平方和，核心指标是SSE(Sum of the squared errors, 误差平方和)

其中，K是聚类数量，p是样本， $m_{k}$ 是第 k 个聚类的中心点，K越大，SSE越小，说明样本聚合程度越高。

当 k小于真实聚类数时，由于 k 的增大会大幅度增加每个簇的聚类程度，故SSE的下降幅度会增大，而当 k 到达真实聚类数时，再增加 k 所得到的聚类程度回报会迅速变小，所以 SSE 的下降幅度会骤减，然后随着 k 值得继续增大而趋于平缓，这个最先趋于平缓的点就是合适的 K 值。

2. 如何选择 k 个初始聚类中心

初始类簇中心点的确定

（1）选择批次距离尽可能远的 k 个点

首先，随机选择一个点作为第一个类簇中心点，然后选择距离该点最远的那个点作为第二个初始类簇中心点，再选择距离前两个点的最近距离最大的点作为第三个初始类簇的中心点，以此类推，直至选出 k 个初始类簇中心点。

（2）选用层次聚类或者Canopy算法进行初始聚类，然后利用这些类簇的中心点作为 k-means算法初始类簇中心点

参考：

https://juejin.im/post/5ed9f6e95188254340630ca6

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Lebron_xueyan CSDN认证博客专家 CSDN认证企业博客

码龄9年

22: 原创

9万+: 周排名

77万+: 总排名

14万+: 访问

: 等级

1222: 积分

37: 粉丝

67: 获赞

39: 评论

381: 收藏

私信

关注

分类专栏

最新评论

目标检测：速度和准确性比较（Fater R-CNN，R-FCN，SSD，FPN，RetinaNet和YOLOv3）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
使用jupyter notebook连接服务器进行远程炼丹
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录。
手把手教你使用VGG19做图像风格迁移
Russelllll: 这个代码没有设置用GPU训练，默认的CPU跑的很慢
解决DHSNet ValueError: operands could not be broadcast together with shapes (224,224) (3, ) (224,224)
zhn15: 请问数据就是黑白图像要怎么解决这个问题呢
手把手教你使用VGG19做图像风格迁移
关键词规范: 边缘不清改哪里

大家在看

简单介绍软件可靠性定义以及相关度量参数

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。