K-means聚类收敛及改进

K-means聚类模型由于初始簇心随机指定可能导致收敛到局部最优解,而预先设定的簇数量也可能不准确。局部最优解是指算法因随机初始化导致无法达到全局最优状态。可以通过多次运行K-means选择最佳结果。此外,可以通过“肘部”观察法或轮廓系数法预估合适的簇数量,以避免过度破坏数据聚类结构。
摘要由CSDN通过智能技术生成

K-means聚类模型采用的迭代式算法,优点暂且不表。其存在两大缺陷:

①初始簇心随机指定,容易收敛到局部最优解

(1)什么叫局部最优解?

全局最优全局最优解
K-means受到随机初始类簇中心点位置的影响,无法保证能够使得三个类簇的中心迭代到上图,会导致下图两种局部最优情况。这样导致无法继续更新聚类中心,使得聚类结果与正确结果有很大出入。
这种情况是算法自身的理论缺陷造成的,无法简单的从模型设计上弥补,但是可以通过执行多次K-means算法来挑选性能表现更好的初始中心点。局部最优

②需要预先设定簇的数量

K-means的k值需要人工指定。可通过**“肘部”观察法或轮廓系数法预估相对合理的类簇个数**。
肘部”观察法:K-menas模型最终期望所有数据点到其所属的类簇距离的平方和趋于稳定,可以通过观察这个数值随着K的走势来找出最佳的类簇数量。
理想条件下,这个折线在不断下降并且趋于平缓的过程中会有斜率的拐点,意味着从这个拐点对应的K

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值