K-means聚类算法

基本概念

 k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。

  1. 聚成多少个簇:由K的值决定
  2. 距离的衡量标准:一般由欧式距离作为距离的衡量标准
  3. 质心的选取:由各向量的均值决定
  4. 目标优化函数:

m i n ∑ i = 1 k ∑ x ∈ c i ( c i , x ) 2 min\sum_{i=1}^k\sum_{x\in c_i}(c_i,x)^2 mini=1kxci(ci,x)2

常见的距离

曼哈顿距离

d = ∣ x 1 − x 2 ∣ + ∣ y 1 − y 2 ∣ d=\lvert x_1-x_2\lvert+\lvert y_1-y_2\lvert d=x1x2+

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值