数据挖掘——聚类算法kmeans整理

【 kmeans算法原理】

  1. 随机选取k个中心点
  2. 遍历所有数据,将每个数据划分到最近的中心点中(根据距离的大小进行划分,即计算每个样本点到所有中心点的距离,选择距离最小的那个)
  3. 计算每个聚类的平均值,并作为新的中心点
  4. 重复2-3,直到这k个中心点不再变化(收敛了),或迭代次数达到规定值
    matlab函数调用:
[IDX,C,sumd,D] = kmeans(X,k,'distance','sqEuclidean','start','sample')  
//距离度量为欧氏距离的平方,初始点从样本X中随机选择k个点
// IDX: 每个样本点所在的类别
//   C: 所聚类别的中心点坐标位置(k*p,p为样本属性的维度)
//sumd: 每个类内各点到中心点的距离之和(1*k)
//   D:每个点到各类中心点的距离(n*k)

【算法的优化

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值