详解K-Means算法

一、引言

K-Means算法是机器学习中最简单、最常见的一种聚类算法。

1.什么是聚类?

通俗来讲,聚类就是将一堆没有标签的原始样本数据,按照某个标准让其中特征一致的样本自动聚成一堆儿,最后原始样本数据聚成了一堆儿一堆儿的。

2.聚类和分类有什么区别吗?

我的理解,通俗来讲的话,聚类之前,我们是不知道有几类的,然后使用聚类算法进行聚。
分类之前,我们是知道类别的,然后使用分类算法,按照各个类别的特征,将原始样本数据进行分类,对应到已经知道的类别。
分类是有监督学习算法,聚类是无监督学习算法。

-------------------------------------------------------------------------

知乎上,我认为不错的回答:
在这里插入图片描述

二、K-Means算法的基本概念

在这里插入图片描述
在这里插入图片描述

三、算法流程

在这里插入图片描述
(a)最开始,样本点都是没有标签的。
(b)这里我们设定K=2,随机生成K个初始质心坐标。
(c)然后遍历每一个样本点,计算每一个样本点到两个质心的欧式距离。距离哪一个距离小,就将当前的样本点归为哪一类。
(d)归类完毕之后,计算归类之后,每一类中样本点的新质心。
(e)再次遍历每一个样本点,计算每一个样本点到新质心的欧式距离,按照距离哪一个质心近的原则,重新归类。
(f)不断重新计算质心坐标,不断重新归类…
直到质心坐标不再更新为为止,那样的话,聚类工作也就完成了!

四、总结

在这里插入图片描述

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值