机器学习之聚类分析(一)--- K-means

K-means是无监督学习中的经典算法,用于数据聚类。算法流程包括随机选择初始中心点,计算样本到中心点的距离并进行分类,然后更新中心点直至收敛。其优点包括简单快速,但缺点如k值难确定、易受噪声影响和可能陷入局部最优。K-means++是改进的初始化方式,能更优地选择中心点。软聚类如模糊C-means允许样本同时属于多个簇。
摘要由CSDN通过智能技术生成

推荐:聚类算法视频教程

聚类是无监督学习中最常用的算法。
在机器学习与数据挖掘中,K-Means((K均值))是一种无监督学习的算法。

1 具体算法流程如下:

(1)随机从样本中选取K个元素,作为k个类别的中心。
(2)分别计算每个样本到k个类别中心的距离,并将这些样本划归到距离最近的类别。即数据点距离哪个中心点最近就分到哪一类中。可以认为距离越近,两者之间越相似。而不同距离的度量其聚类结果不同。各种距离的计算
(3)将每个类别中心更新为隶属该类别所有样本均值
(4)重复2~3步,直到迭代次数达到一定值或者每一类中心点移动小于某个临界值(即认为已经收敛)。

2 K-means的目标函数
(多次运行K均值,产生的多个不同的簇集,优选SSE最小的。)在这里插入图片描述<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值