K-means ++

K-means ++算法是一种改进的聚类方法,旨在解决K-means聚类中初始中心点选择的问题。该算法通过概率方式确保选择的聚类中心彼此距离较远,从而提高聚类效果的稳定性。K-means的主要挑战包括确定合适的K值和随机种子点的影响,而K-means++则提供了一种有效选择初始点的策略。算法包括随机选择一个点作为起点,然后按概率选择距离现有中心较远的点作为后续中心,直至达到预设的K值。最后,使用这些中心运行标准K-means算法。
摘要由CSDN通过智能技术生成

       K-means ++是解决K-means聚类中心初始化的问题,能有效地选择初始点。 保证初始的聚类中心之间的相互距离要尽可能的远。wiki上对该算法的描述是如下:

  1. 从输入的数据点集合中随机选择一个点作为第一个聚类中心
  2. 对于数据集中的每一个点x,计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)
  3. 选择一个新的数据点作为新的聚类中心,选择的原则是:D(x)较大的点,被选取作为聚类中心的概率较大
  4. 重复2和3直到k个聚类中心被选出来
  5. 利用这k个初始的聚类中心来运行标准的k-means算法
     下面关于K-means的描述来自 http://coolshell.cn/articles/7779.html 这篇文章

K-Means主要有两个最重大的缺陷——都和初始值有关:
 
1、
K 是事先给定的,这个 K 值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适。( ISODATA 算法通过类的自动合并和分裂,得到较为合理的类型数目 K)
2
K-Means算法需要用初始随机种子点来搞,这个随机种子点太重要,不同的随机种子点会有得到完全不同的结果。(K-Means++算法

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值