机器学习聚类算法——K-means聚类

K-means聚类是一种常见的机器学习算法,用于将数据点分组到K个簇中。该算法通过迭代更新数据点的归属和聚类中心,以最小化簇内平方误差和。从优化角度来看,它是一个迭代的爬山法过程,可能收敛于局部最优解。算法的优点包括简单快速,但对初始聚类中心的选择敏感,可能导致不同的结果或局部最优。为了避免这个问题,可以选择多样化的初始中心点。
摘要由CSDN通过智能技术生成

k均值算法

k-means聚类又称k均值聚类。
给定N个数据点 { xnRM,n=1,,N} ,M是数据点的维度。现在希望把数据点聚类成K个簇。


算法:

(1)初始化:在给定的N个样本中随机选择K个作为初始聚类中心
(2)更新划分:对每个数据点,计算其到各个聚类中心的距离,并把它归到距离最近的类
(3)更新聚类中心:计算各个类簇中数据点在每个维度上的均值,将求得的均值点作为新的聚类中心
(4)判断是否收敛:如果聚类中心的改变不超过预先设置的阈值或者损失的改变不超过设定的阈值,那么认为收敛;否则,转到步骤(2) 


从优化角度看待k均值算法

给定N个数据点 { xnRM,n=1,,N} ,M是数据点的维度。现在希望根据空间位置把数据点聚类成K个簇,使得损失函数

J(C,U)=ΣnΣkcnkDistance(xnuk)

最小。其中,聚类矩阵 CRNK ,(n,k)位置上的元素
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值