聚类算法(1):K-Means算法

        聚类分析,简单的说,就是对数据分群,它以相似性为基础,相同类中的样本比不同类中的本更具相似性。在商业应用中,聚类通常用来划分用户群,然后分别加以研究。另外,它还可以挖掘数据中潜在的模式,基于此改进业务流程或设计新产品等。常见的聚类算法有k- Means算法、系统聚类算法,下面将依次介绍。

目录

 1. K-Means算法

(1)用于衡量好的标准

(2)K- Means实现的基本步骤

 2. 代码实现

(1)R语言

(2)Python实现


 1. K-Means算法

        K- Means算法是一种基于划分的经典聚类算法,对于给定的含有N条记录的数据集,算法将把数据集分成k组(k<N),使得每一分组至少包含一条数据记录,每条记录属于且仅属于一个分组。算法首先会給出一个随机初始的分组,再通过反复迭代改变分组,使每一次改进的分组比上一次好。

(1)用于衡量好的标准

       同一分组中的记录越近越好,而不同分组中的记录越远越好,通常使用欧氏距离作为相异性度量。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

满腹的小不甘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值