使用k均值算法对一维数组聚类（求自然间断点）

最新推荐文章于 2024-08-20 10:11:40 发布

niewzh

最新推荐文章于 2024-08-20 10:11:40 发布

阅读量1w

点赞数 3

分类专栏： GIS算法设计与分析 Python科学计算

本文链接：https://blog.csdn.net/ScapeD/article/details/88396147

版权

Python科学计算同时被 2 个专栏收录

15 篇文章 2 订阅

订阅专栏

GIS算法设计与分析

7 篇文章 2 订阅

订阅专栏

一维数组，例如：

班级中学习成绩分布聚类。

K-Means算法可以对多维数据进行聚类，Jenks Natural Breaks和K-Means在一维数据时，完全等价。

它们的目标函数一样，但是算法的步骤不完全相同。K-Means是先设定好K个初始随机点。而Jenks Breaks则是用遍历的方法，一个点一个点地移动，直到达到最小值。

此处使用sklearn库中提供的K-Means函数进行数据聚类

1、安装 sklearn

pip install sklearn

2、分类代码

from sklearn.cluster import KMeans
import numpy as np
x = np.random.random(10000).reshape(-1,1)
km = KMeans(n_clusters=5)
km.fit(x)
print(km.cluster_centers_)

注意 km.cluster_centers_为类别的中心点，这是该方法与jenkspy库结果的差别，jenkspy库得出结果为类别边界。

KMeans()类中，参数n_clusters=5表示类别个数。

经测试，在数据量为10000时，速度2s左右，效率较高。

参考文章：

https://www.cnblogs.com/lianyingteng/p/7811126.html

https://www.biaodianfu.com/clustering-on-a-one-dimensional-array.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

niewzh

关注关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

一维数据聚类

围城

09-24

2848

20220924 -在以往的学习中，通常聚类行为都是应用于高维数据，或者利用2维数据，最为实验性验证过程。但是最近遇到了一项任务，对某数据处理的结果进行处理，处理完之后，数据只有一维，如果数据内容比较简单，那么用直方图绘制之后，可以发现只有两个簇，而且距离也比较远。当然，这种情况比较少。那么这里其实引发一个问题，怎么来划分开两个类别，这也是我思考的问题。一开始的时候，我也不太理解，就想着利用聚类的方法。那么首先想到的就是kmeans这种方式咯。

一维数组kmeans聚类c语言,一维数组的 K-Means 聚类算法理解

weixin_39901404的博客

05-21

974

刚看了这个算法，理解如下，放在这里，备忘，如有错误的地方，请指出，谢谢需要做聚类的数组我们称之为【源数组】需要一个分组个数K变量来标记需要分多少个组，这个数组我们称之为【聚类中心数组】及一个缓存临时聚类中心的数组，我们称之为【缓存聚类中心数组】然后初始化一个K长度的数组，值随机(尽量分布在原数组的更大的区间以便计算)，用于和源数组进行比对计算。下面是计算的部分：死循环遍历对源数据进行分组。分组内遍...

2 条评论您还未登录，请先登录后发表或查看评论

推荐项目：Jenkspy，快速的Fisher-Jenks算法实现

最新发布

gitblog_00553的博客

08-20

400

【深度学习】一维数组的聚类

TwcatL_tree

12-08

2285

在学习聚类算法的过程中，学习到的聚类算法大部分都是针对n维的，针对一维数据的聚类方式较少，今天就来学习下如何给一维的数据进行聚类。

一维均值聚类算法matlab程序

07-04

　k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的。　　k-means 算法的工作过程说明如下：首先从n个数据对象任意选择 k 个对象作为初始聚类中心；而对于所剩下其它对象，则根据它们与这些聚类中心的相似度（距离），分别将它们分配给与其最相似的（聚类中心所代表的）聚类；然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。

kmeans聚类：一维数据的kmeans聚类算法的实现

02-09

kmeans聚类：一维数据的kmeans聚类算法的实现

【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 一维数据的 K-Means 聚类 ) ★

让学习成为一种习惯 ( 韩曙亮の技术博客 )

12-28

7814

一、 K-Means 聚类算法流程、二、一维数据的 K-Means 聚类、 1、第一次迭代、 2、第二次迭代、 3、第三次迭代、 4、第四次迭代

k-均值聚类算法实现灰度图像分割_K均值算法_K._图像聚类_图像聚类_图像分割_

10-04

k-均值算法的目标是将数据集划分为k个互不相交的子集（聚类），每个子集由一个聚类中心代表，使得所有样本点到其所在类别的聚类中心的距离平方和最小。算法主要包括以下步骤： 1. 初始化：选择k个初始聚类中心，...

一维均值聚类matlab程序

04-07

一维均值聚类，也称为K-means聚类，是一种广泛应用的数据分析方法，尤其在机器学习和统计领域。其核心在于通过迭代优化将数据集中的对象分配到预先设定的类别（或聚类）中，以实现聚类内部对象的相似度最大化，而...

python函一维聚类_聚类实战：一维数组数据聚类

weixin_39926016的博客

12-11

5932

大部分聚类方法针对的是多维数据，现实场景中还有可能存在以为数据的情况，针对以为数组的聚类和多维的数据有很大的不同，今天就来实战演练下：需求内容：分析订单的价格分布常见方案：按照100为梯度，分析不同价格区间的订单量存在缺陷：现实生活中，定价存在一些自然的价格分隔，如果按照步距划分可能存在一些偏差，比如airbnb的价格筛选显示出的房价分布：解决上述缺陷最好的方式是对价格进行聚类，找出做合适的价格区...

Kjunzhi.rar_K._k均值三维数据_k均值聚类_三维K均值聚类_三维聚类分析

09-19

在这个名为“Kjunzhi.rar”的压缩包文件中，我们关注的是如何运用K均值算法对三维数据进行聚类分析。在三维空间中，每个数据点可以表示为一个由三个坐标值（x, y, z）组成的向量。K均值算法的核心思想是通过迭代...

k-means对一维数组进行聚类的代码，适合初学者

01-21

关于k-means聚类的原理可以参考这篇博客： https://blog.csdn.net/sinat_36710456/article/details/88019323 本篇只讨论基本的代码实现，由于只是对一维数组的聚类，距离公式上比较简单：distance = |a – b| 适合初学者理解最基本的原理所谓一维数组 比如： [12, 3, 56, 89, 78, 2, 12, 45, 255, 236] 以下代码实现的是对一组数字的聚类类别的个数可以设置，改变参数n的值即可代码如下（建议从最下边的主函数开始看起）： import numpy as np impor

kmeans算法c语言实现，能对不同维度的数据进行聚类

10-28

K-means聚类算法c语言实现。样本数据从文件读入，支持任意维数数据和任意k值（k当然要小于样本数）.原创原创！

python一维数组聚类

qq_29579431的博客

08-12

7331

问题使用scikit-learn中的DBSCAN算法对一维数据进行聚类，最开始总是出错，得到的结果只有行数据。经过排错分析发现一维数组应该变成列向量然后进行聚类解决最开始定义numpy数组为如下定义 X = np.array(count_list).reshape(1, -1) 这样进行聚类的话，会当成一条数据进行聚类，应该改成如下格式 X = np.array(count_list).r...

机器学习算法一之基于K均值聚类算法实现数据聚类及二维图像像素分割

yohnyang的博客

07-07

1809

K均值聚类算法的时间复杂度是O(nmk),n表示样本个数，m表示样本维数，k表示类别个数。算法实现：

机器学习实战（九）K-均值聚类算法

陌若安生的博客

08-17

1379

文章目录前言：一、K-均值聚类算法二、算法分析三、二分k均值聚类前言：机器学习中有两类的大问题，一个是分类，一个是聚类。分类是根据一些给定的已知类别标号的样本，训练某种学习机器，使它能够对未知类别的样本进行分类。这属于supervised learning（监督学习）。聚类指事先并不知道任何样本的类别标号，希望通过某种算法来把一组未知类别的样本划分成若干类别，这在机器学习中被称作 unsu...

K_means聚类，利用matlab实现对一维数据的聚类

angie2011的博客

03-12

4193

K_means算法的具体过程 1、从数据集{X} 中任意选取k个赋给初始的聚类中心c1, c2, …, ck； 2、对数据集中的每个样本点xi，计算其与各个聚类中心cj的欧氏距离并获取其类别标号： 3、按下式重新计算k个聚类中心； 4、重复步骤2和步骤3，直到达到最大迭代次数、聚类目标函数达到最优值或者两次迭代得到的目标函数变化小于给定的较小值为止将令k...

一维数据聚类matlab程序,关于一维数据的聚类问题

weixin_32752813的博客

04-02

1022

data = [0.497 0.517 0.551 0.577 0.577 0.577 0.577 0.577 0.577 0.577 0.577 0.577 0.577 0.577 ...

【深度学习】一维数组的 K-Means 聚类算法理解

TwcatL_tree

12-08

1539

分组内遍历原数组的每个元素与聚类中心的每个元素的距离（差值的绝对值），将最小距离的聚类中心数组下标缓存的临时变量临时变量数组A中（长度=原数组），对分组后的数组计算中间值存入缓存聚类中心数组，比较缓存剧烈数组和聚类数组，是否位置一样，值一样，如果一样跳出死循环，分类结束，然后初始化一个K长度的数组，值随机（尽量分布在原数组的更大的区间以便计算），用于和源数组进行比对计算。遍历临时变量数组A，使用A的小标拿到原数组对应的值，赋值给分组数组。一个缓存临时聚类中心的数组，我们称之为【缓存聚类中心数组】

建立三维数组K类均值聚类算法模型

06-09

因此，我们可以使用K均值聚类算法对三维数组进行聚类。下面是建立三维数组K均值聚类算法模型的步骤： 1. 初始化K个聚类中心点。可以随机选择数据集中的K个点作为聚类中心点。 2. 计算每个点到每个聚类中心点的...