K-means、K-means++、Mini Batch k-means

K-means

K-means算法的基本步骤

1.从n个数据中任意选择 k 个对象作为初始聚类中心
2.通过把每个点分配给最近的聚类中心,从而形成K个类,重新计算每个类的聚类中心
3.终止条件:如果计算后,聚类中心不发生改变

每个类别聚类中心的计算方法

每个类中所有样本取值的均值(质心)

k-means时间空间复杂度

时间复杂度:O(i* n* k* m)
空间复杂度:O(n* m)
k是需要聚类的数量,m为每个元素属性个数(向量的维度),n为数据量,i为迭代次数
一般均可认为是常量,所以时间和空间复杂度可以简化为O(n)

改进

K-means是常用的聚类算法,但其算法本身存在一定的问题,例如在大数据量下计算时间过长就是一个重要问题,
可以从两方面进行改进,一方面:通过改变初始聚类中心的选择,从而减少迭代次数;另一方面:随机抽取一部分样本代表各自类型进行计算,而不是使用全部样本进行更新计算。主要是以下两个改进方法:K-means++、Mini Batch k-means

K-means+&#

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值