聚类算法（1）：K-Means算法

最新推荐文章于 2024-08-28 11:16:39 发布

满腹的小不甘

最新推荐文章于 2024-08-28 11:16:39 发布

阅读量1.6k

点赞数

分类专栏：机器学习 & 统计分析实用算法文章标签：机器学习数据挖掘 K-Means聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27586341/article/details/93037167

版权

机器学习 & 统计分析实用算法专栏收录该内容

21 篇文章 0 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

聚类分析，简单的说，就是对数据分群，它以相似性为基础，相同类中的样本比不同类中的本更具相似性。在商业应用中，聚类通常用来划分用户群，然后分别加以研究。另外，它还可以挖掘数据中潜在的模式，基于此改进业务流程或设计新产品等。常见的聚类算法有k- Means算法、系统聚类算法，下面将依次介绍。

目录

1. K-Means算法

（1）用于衡量好的标准

（2）K- Means实现的基本步骤

2. 代码实现

（2）Python实现

1. K-Means算法

K- Means算法是一种基于划分的经典聚类算法，对于给定的含有N条记录的数据集，算法将把数据集分成k组(k<N)，使得每一分组至少包含一条数据记录，每条记录属于且仅属于一个分组。算法首先会給出一个随机初始的分组，再通过反复迭代改变分组，使每一次改进的分组比上一次好。

（1）用于衡量好的标准

同一分组中的记录越近越好，而不同分组中的记录越远越好，通常使用欧氏距离作为相异性度量。

了解本专栏

超级会员免费看

满腹的小不甘

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

满腹的小不甘 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。