k-meas算法

k-means是非监督学习中的聚类算法,与kNN的相似之处在于都利用近邻信息。算法流程包括初始化质心,迭代更新直到质心不变。k-means存在局部最优和k值选择困难的问题。二分k-means通过将大cluster分裂解决局部最优问题,通过k-1次分裂形成k个cluster。
摘要由CSDN通过智能技术生成

k-means & KNN

k-means与kNN虽然都是以k打头,但却是两类算法——kNN为监督学习中的分类算法,而k-means则是非监督学习中的聚类算法;
二者相同之处:均利用近邻信息来标注类别。

k-means基本算法

在k-means算法中,用质心来表示cluster;且容易证明k-means算法收敛等同于所有质心不再发生变化。基本的k-means算法流程如下:

选择K个点作为初始质心  
repeat  
将每个点指派到最近的质心,形成K个簇  
重新计算每个簇的质心  
until 簇不发生变化或达到最大迭代次数 

这里写图片描述
对于欧式空间的样本数据,以平方误差和(sum of the squared error, SSE)作为聚类的目标函数,同时也可以衡量不同聚类结果好坏的指标:

SSE=i=1kxCidist(x,ci)2 S S E = ∑ i = 1 k ∑ x ∈ C i d i s t ( x , c i ) 2
表示样本点 x x 到cluster C i
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值