kmeans

简介

kmeans聚类算法自1965年已经提出50多年,具有容易实施,简单,高效的优点,也有很多学者对kmeans算法进行改进,得到了很多优化策略。
kmeans是基于划分的聚类方法,将样本集组成的矢量空间划分成多个区域 Siki=1 ,每个区域都存在在一个区域相关的表示 ciki=1 ,通常称为区域中心,kmeans的目标是将数据集划分成k簇,使得划分后的k类子集合满足误差平方和最小(SSE),

J(s)=argmin||xci||22

其中 x 是空间中的点,表示给定的数据对象,ci是簇的形心,该公式即表示簇中的每个对象到簇中心距离的平方和。
更新聚类中心公式:
ct+1i=1|sti|xi

经典算法

经典的kmeans算法作为无监督分类方法,需要预先知道要分的类数K,其算法流程如下:

算法k-means 用于聚类
输入:

  • k:簇的数目
  • D:包含n个对象的数据集

输出:

  • k个簇的集合

方法:

  • 初始化k个对象作为簇中心
  • loop
  • 分配各样本到相近的聚类集合中
  • 更新聚类中心
  • until 聚类中心变化在允许误差内

复杂度分析

t=t+tkt
t=knd (d表示平方和)
t=nd

算法优化-Kmeans++

–待续

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值