机器学习10-k-means算法

K-means算法

在这里插入图片描述
K-means主要由簇分配和移动聚类中心两部分组成,是一种迭代的算法,2个簇的流程可如下描述:

簇分配:随机选择两个样本点,作为簇中心,将每个样本划分至距离更近的簇中心,作为它所属的簇
移动聚类中心:分别计算两个簇中,属于这个簇所有样本的均值,将这个取平均后的向量位置作为当前簇新的中心
重新进行簇分配、移动聚类中心,不断迭代,直到聚类中心不再改变
用伪代码,可作如下描述:

在这里插入图片描述

优化目标函数

在这里插入图片描述

随机初始化

在这里插入图片描述
注:K-means聚类算法有时候会陷入局部最优解。

如下图所示:
在这里插入图片描述

K值(簇的数量)

簇的数量的选择,通常有两种方法,均要求 K< m :

人工选择:根据需求或者已知的知识,进行人工选择簇的数量
肘部法则:如下图所示(图源:吴恩达机器学习),尝试不同的 K ,选择变化率明显变缓的“肘部点”
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值