kmeans的手肘法

  关于kmeans的算法遇到有几个问题。还未解决,写个博客mark一下,也欢迎各位高手指点~

  1. 中心点选取

    在随机选取情况下,Kmeans算法可以实现,且优点为第一次选取中心点时,由于选择随机选取的算法,时间复杂度不高。但缺点为会出现两个中心点间隔近,k=4时,出现的结果和现象不符,如下图所示。
    在这里插入图片描述
    猜测:和点密集的聚集在(12,0)的领域,故两个中心点出现在同一簇。

  2. 手肘法拐点的选取
    随着分类的类别数增加,SSE的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,手肘法即为选取那个拐点。

在这里插入图片描述

  实际上拐点的确不好确定,查阅多份网络博客,均采用目测法。但从斜率变化角度来看,下图中,k=2-3的斜率和k=3-4的斜率用目测法难以比较,趋于平缓的拐点任可以看出。从该角度看,斜率前后变化的参考价值低一些,以斜率基本不变作为判断拐点的依据更佳。

在这里插入图片描述
  基于上述的思想,可采取斜率判断法来选取拐点:找出第一个与下一个点之间斜率小于1(选取一个较小的常数即可,本实验选取为1)的点作为拐点。
  优点:可用代码实现,可避免目测带来的误差。
  缺点:面对斜率变化有波动的情况,该方法会出现误判拐点,如下图:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值