K-均值算法 (K-Means Algorithm)

又名K-均值聚类算法 (K-Means Clustering Algorithm),非监督式学习常用的聚类算法。

1. 实现

给定:
- 训练样本 {x(1),x(2),...,x(m)}, x(i)Rn
- 分类数目 K

随机初始化K个聚类中心 (Culster Centroids) μ1,μ2,...,μKRn
重复以下两步:
1. 对 i=1 m c(i)=x(i)最接近的聚类中心所属类别(取值为1到K)
2. 对 j=1 K μk=所有分配至此类别的 x(i) 的平均值
直到结果收敛。


2. 应对局部最优

为尽量避免收敛结果为局部最优,可随机初始化多组聚类中心,从中选择使得Cost函数取值最小的一组。

Cost函数(Distortion函数)
J(c(1),...c(m),μ1,...μK)=1mi=1mx(i)μc(i)2


3. K值选择

运用Elbow Method(不总是有效)或根据实际应用情境。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值