统计学习方法02-14.3 k-means聚类

本博客主要用于本人重新复习知识点,所有参考列在文尾。如有错误,希望一起交流。

基础知识

k-means 聚类是基于样本集合划分的聚类算法。属于硬聚类。

  • 具体:将样本集合划分为k个子集,构成k个类,每个样本到其所属的类中心的距离最小。
  • k个聚类特点各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
  • k-means算法的基础最小误差平方和准则
  • 迭代算法,不能保证得到全局最优

1. 模型

  • k-means 聚类的目标:将n个样本分到k个不同的类或者簇中,假设 k < n k<n k<n.
  • k-means 聚类的模型是一个从样本到类的函数: l = C ( i ) l=C(i) l=C(i),其中 i i i 表示每一个样本(共n个), l l l 表示每一个类别(共k个)。

2. 策略

k-means 聚类的策略:通过损失函数的最小化选取最优的划分或函数 C ∗ C^* C.
样本之间的距离定义为欧氏距离平方: d ( x i , x j ) = ∑ k = 1 m ( x k i − s k j ) 2 = ∣ ∣ x i − x j ∣ ∣ 2 d(x_i,x_j)=\sum \limits_{k=1}^m(x_{ki}-s_{kj})^2=||x_i-x_j||^2 d(xi,xj)=

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值