k-means算法例题应用

weixin_su

已于 2022-09-12 14:41:15 修改

阅读量2.6w

点赞数 46

分类专栏：机器学习大数据文章标签：机器学习算法

于 2022-04-04 16:50:01 首次发布

本文链接：https://blog.csdn.net/weixin_41145305/article/details/123951397

版权

简单介绍：k-means 算法是一个聚类的算法。属于无监督学习算法，也是就样本没有label(标签)，然后根据某种规则进行“分割”，把相同的或者相近的放在一起。

算法缺点：不能帮助我们自动分类，需要指定。在很多实际应用当中，很难知道数据是什么分布的，应该分成几类比较好。这也是k-means自身的一个缺陷。

在这里K就是我们想要分割的的聚类的个数。

算法步骤：

先定义总共有多少个类/簇(cluster)
将每个簇心(cluster centers)随机定在一个点上
将每个数据点关联到最近簇中心所属的簇上
对于每一个簇找到其所有关联点的中心点（取每一个点坐标的平均值）
将上述点变为新的簇心
不停重复，直到每个簇所拥有的点不变

例题：

假设有如下8个点：(3,1),(3,2),(4,1),(4,2),(1,3),(1,4),(2,3),(2,4)。使用K-means算法对其进行聚类。设初始聚类中心分别为(0,4)和(3,3)。请写出详细的计算过程。
过程如下：
1 数据
数据集

X

数据集
	X

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_su

关注关注

46
点赞
踩
310

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

kmeans算法练习

qq_35210105的博客

01-01

2883

在 http://taoblog421.cn/posts/27782ca8/#more的基础上完成一个练习现在有部分餐饮客户的消费数据存于数据文件consumption. csv，其中R表示最近一次消费时间间隔，F表示消费频率，M表示消费总金额。编程实现K-Means聚类算法，将客户分类成3类客户群，并评价这些客户群的价值。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RRIQbEQ5-1609490837677)(https://i.loli.net/2021/01/0

机器学习-KMeans算法案例

J_kaiz的博客

12-15

2337

1.某电信运营商获得若干用户通讯行为数据（“data_02”），有字段“通货次数”， ”短信次数”,”即时通讯次数”,”网页浏览次数”，使用 KMeans 算法，对这部分客户群体进行合理分群。 import numpy as np,pandas as pd import matplotlib.pyplot as plt from sklearn.cluster import KMeans fro...

2 条评论您还未登录，请先登录后发表或查看评论

k-means算法实例

11-21

一个聚类算法(k-means)实例，对想实践一下K_means算法的朋友很实用

聚类算法和Kmeans算法

最新发布

taisu001的博客

04-15

680

这篇文章围绕聚类算法展开，介绍了聚类算法的基本概念、应用场景和分类，包含划分、层次、密度、谱聚类等。以 K-means 为例，阐述其 API 使用、算法流程，通过随机数据集演示聚类过程。介绍了 SSE、SC、CH 等评价指标及肘部法确定最佳 K 值。在客户分析案例中，利用 K-means 对客户数据聚类，找出黄金客户群。还指出 K-means 应用时需注意异常数据和样本量过大问题，引出 MiniBatchKMeans 算法，其在海量数据处理上效率高且准确性损失小。

数据挖掘-K-Means算法

二十同学

12-02

5万+

微信搜索：“二十同学” 公众号，欢迎关注一条不一样的成长之路今天说聚类，但是必须要先理解聚类和分类的区别，很多业务人员在日常分析时候不是很严谨，混为一谈，其实二者有本质的区别。分类其实是从特定的数据中挖掘模式，作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器，一开始的时候可能什么都不过滤，在日常使用过程中，我人工对于每一封邮件点选“垃圾”或“不是垃圾”，过一段时间，Gmail就体现出一定的智能，能够自动过滤掉一些垃圾邮件了。这是因为在点选的过程中，其实是给每一条邮件打了一个“标签”，这个标签只有

k-平均算法(k-means算法)(k均值算法)例题

m0_46400910的博客

12-09

2万+

k-平均算法(k-means算法)（k均值算法）例题簇的数目k=2 下表数据表（n=8）行数据

Kmeans算法及其示例

渣渣

05-25

2万+

Kmeans算法 Kmeans是简单的聚类分析算法。其常用在数据分析与人工智能中。简单说，Kmeans算法就是把一个集合中的东西分为若干子集，这几个子集内的元素具有空间相近或者特点相近。做法： 1. 随机选取K各中心点，生成对应的k个簇。 2. 遍历所有的数据点，依据“距离’”将每一个数据点划分到最近的中心点所在的簇。 3. 计算每个簇所有的数据点的平均值

K-means算法的Matlab实现代码（使用文档+源代码）,k-means算法例题,matlab源码.zip

10-17

K-means算法是一种广泛应用的无监督学习方法，主要用于数据聚类。它的主要目标是将数据集分割成K个互不重叠的簇，使得每个数据点都属于与其最近的簇中心。在Matlab环境中实现K-means算法，可以帮助我们更好地理解和...

聚类算法---k-means算法

winterhc的博客

04-24

1311

学习目标：聚类算法学习内容： k-means算法学习记录：聚类算法主要有：（1）划分聚类。大部分是基于距离的聚类算法。有k-means,k-medoids,CLARANS. （2）层次聚类。是进行层次化的分解，到某种条件满足为止。有BIRCH,CURE,CHAMELEON. (3)密度聚类。基于密度的算法。有DBSCAN,OPTICS,DENCLUE. 距离计算有闵可夫斯基距离，欧几里得距离，曼哈顿距离，切比雪夫距离。皮尔逊相关系数，余弦相似度，杰卡德相似系数。这一部分内容下一篇文章

Kmeans算法及简单案例

m0_47482052的博客

01-04

1万+

Kmeans算法及简单案例

k-means算法的一个简单实现

03-28

NULL 博文链接：https://lqzit.iteye.com/blog/1222433

k-means两个示例

03-04

一共两个例子，python3+k-means+matlab，我亲测，在python3.6环境下，可以使用。其他版本没测过。对初学者帮助不错，高手就不要点进来啦！有问题，咨询邮箱。记住一共两个例子，别混了

KMean聚类练习_K-means练习题_k均值习题_新手练习python_

10-03

自己照着做的一些kmeans练习，适合新手看

用matlab实现kmeans算法，非常完整例子一维和二维

11-30

用matlab实现kmeans算法，非常完整例子一维和二维

kmeans聚类案例

03-13

kmeans聚类的案例，包含测试的模拟数据xml文件，kmeans聚类分析代码

K-means聚类的实现以及案例讲解

热门推荐

A496608119的博客

03-26

6万+

1 k-means聚类步骤 1、随机设置K个特征空间内的点作为初始的聚类中⼼ 2、对于其他每个点计算到K个中⼼的距离，未知的点选择最近的⼀个聚类中⼼点作为标记类别 3、接着对着标记的聚类中⼼之后，重新计算出每个聚类的新中⼼点（平均值） 4、如果计算得出的新中⼼点与原中⼼点⼀样（质⼼不再移动），那么结束，否则重新进⾏第⼆步过程通过下图解释实现流程： 2. 案例联系 1、随机设置K个特征空间内的点作为初始的聚类中⼼（本案例中设置p1和p2） 2、对于其他每个点.

k-means算法实例（聚类分析）matlab实现

algorithem的博客

11-22

1万+

例子如下：假设数据挖掘的任务是将如下的8个点（用（x，y）代表位置）聚类为3个簇。距离是欧氏距离。假设初始我们选择，和分别为每个簇的中心，用k-均值算法给出： a)在第一轮执行后的3个簇中心 b)最后的三个簇算法思想：算法：k-均值。用于划分的k-均值算法，其中每个簇的中心都用簇中所有对象的均值来表示。输入： k:簇的数目 D:包含n个对象的数据集输出：k个簇的集合。方法：（1）从D中任意选择k个对象作为初始簇中心；（2）repeat （3）根据簇中对象的均值，将每个对象分配到最相似

K-means算法实例

qq_52108058的博客

12-21

533

标签： [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1。随机生成了两个簇，随机选取两个中心点，然后通过k-means算法不断地聚类，等到两个中心的距离小于0.001收敛时，停止聚类。最后的聚类中心：-------》 [[19.70951928 25.17353345]每次的族类中心 [[20.15008182 22.46043598]每次的族类中心 [[19.70951928 25.17353345]

k-means算法例题以及matlab代码

07-08

题目：给定一个数据集，包含n个数据点，要求用k-means算法将其进行聚类。首先，我们来看一个简单的例子。假设有一个包含10个点的数据集，每个点用二维坐标表示。我们要将这些点分为两个簇。数据集如下： (1, 1...