机器学习---算法基础(七)K-means算法

Kmeans算法介绍

K-means算法是将样本聚类成k个簇(cluster)将相近的数据点分配到同一个簇中。

其基本的算法思想为:

  1. 随机选择K个聚类中心点(不一定为数据点,有可能选择的是距)
  2. 计算其他点到这K个点的距离,将每个点分配到距离其最近的点中
  3. 随机重新选择K个点,重新计算每个簇的质心(计算每个点矩阵相加的平均值,并作为新的中心点)
  4. 重复2,3步,最后的到最优的K点

Kmeans的算法收敛

对于分类算法,我们使用欧氏距离相加的平均值作为损失函数,通过损失函数来评价分类的好坏。

Kmeans算法是一种迭代的算法,我们希望每一次的迭代中,分类的性能更好,这对应着损失函数需要越小越好。Kmeans算法的损失函数为:MSE

Kmeans算法是初值敏感的

对于随机选择的K个初始点。如果K个点本身都是属于同一类的,那很容易造成分类结果的错误。那我们一般在取初始值的时候会取几个点间隔比较大的。(通过概率性选择)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值