聚类算法实验常用数据集

一路冰雨

于 2022-02-12 01:59:10 发布

阅读量9.2k

点赞数 7

文章标签：聚类算法机器学习

本文链接：https://blog.csdn.net/weixin_46005626/article/details/122891487

版权

文章目录

前言
一、二维人工数据集
二、UCI真实数据集
下载地址

前言

本文包含了我在实验中使用和收集到的一些非常好(经典聚类算法效果都不大行)的数据集，已经对数据和标签进行了分离，txt格式，直接用，very good！

一、二维人工数据集

包含了简单的流形数据，球形数据，无噪声数据，复杂结构包含噪声的数据集。
在这里插入图片描述

二、UCI真实数据集

包含了10个数据集

Dataset	Dimensions	Clusters
iris	4	3
wine	13	3
control	60	6
segment	19	7
pendigits	16	10
letter	16	26
glass	10	6
ionosphere	34	2
optdigits	64	10
vehicl	18	4

下载地址

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一路冰雨

关注关注

7
点赞
踩
38

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

聚类分析常用数据集

03-26

聚类分析常用的人工数据集，包括：UCI:wine、Iris、yeast，还有4k2_far、leuk72_3k等数据集。它们在聚类分析、数据挖掘、机器学习、模式识别领域经常用到。

常见聚类数据集人工数据和UCI数据都有

01-26

这里面是机器学习里面聚类所需的数据集，分为人工的二维数据集，如月牙形，双螺旋型等，和UCI真实数据集，是我搜集好久才弄出来的，有一些二维数据集是自己生成的，提供给大家做算法实验。

1 条评论您还未登录，请先登录后发表或查看评论

聚类分析算法常用数据集

03-15

聚类分析算法常用数据集

聚类算法常用数据集（二维人工数据集+UCI真实数据集）

02-12

二维人工数据集：6个数据 xxx.txt 标签 xxx_cl.txt UCI真实数据集：10个数据 xxx.txt 标签 xxx_label.txt

聚类分析、机器学习及数据挖掘中常用数据集

09-02

在聚类分析、机器学习、数据挖掘中常用到的数据集，包括：UCI的数据集wine,yeast,iris等，还有USPS数据集，4k2_far,leuk72_3k数据集等。

08-14

10-30

研究者可以利用这些数据集进行实验，以便探索不同聚类算法的适用性、效率和准确性。聚类算法的选择可能依赖于数据集的特点，例如数据的维度、簇的形状和大小、数据的分布等。聚类算法本身有很多种，包括K均值（K-...

聚类算法常用数据集.zip

06-06

标题为“聚类算法常用数据集.zip”的压缩包文件，显然提供了多个用于聚类算法测试和验证的二维坐标数据集。聚类是一种无监督学习方法，它试图根据数据的相似性或差异性将数据分组，而无需事先知道具体的类别信息。...

GMM 聚类算法，在几个数据集上做实验对比

11-07

K-Means是一种简单且常用的聚类算法，其基本思想是将数据分配到最近的聚类中心，然后更新中心为该聚类内所有点的平均值。该过程迭代进行，直到聚类中心不再显著移动。 2.1 K-Means的实现步骤： 1. 初始化聚类中心：...

聚类、分类所用数据集

01-07

做聚类、分类时很经典的测试数据集，可以很好的检测你所设计的算法。我所上传的数据集格式是.mat格式，用load命令就可以加载。

聚类原始数据集

10-26

聚类数据集 %% 利用不同方法对债券样本进行聚类 %说明 %分别采用不同的方法，对数据进行聚类 %可以选择的pdist/clustering距离 % methods = {'euclidean'; 'seuclidean'; 'cityblock'; 'chebychev'; ... % 'mahalanobis'; 'minkowski'; 'cosine'; 'correlation'; ... % 'spearman'; 'hamming'; 'jaccard'}; %Y=pdist(X) 生成各数据点之间距离的行向量 %squareform(Y) 生成方阵（i，j）代表i个点与j各点之间的距离 %聚类方法： %k-means %kidx=kmeans(bonds,numClust,'distance',dist_k); %层次聚类 %hidx=clusterdata(bonds,'maxclust',numClust,'distance',dist_h,'linkage',link); %liankage产生层次聚类树 %获取距离矩阵，第二参数指定距离计算方法

数据挖掘聚类分析技术实验常用真实数据集

03-19

全部为txt文档数据，数据挖掘聚类分析技术，算法实验过程中，经常用到的经典UCI、UPSP等真实数据集，常用于算法的实验验证。文档中注有相应的数据量、属性等信息，可直接进行使用。

常用聚类分类数据集（32个txt格式）

12-04

二维多维不同簇数的点集，螺旋分布、月牙分布、环形分布等数据集，共30余种

聚类算法测试数据集.zip

08-18

本人整理的csv格式的点云数据，可以用来测试和验证k-means、dbscan或者是自己开发的聚类算法。

聚类分析数据集_《NBA球员数据集聚类分析》

weixin_39653361的博客

12-16

2282

Hello大家好，今天为大家送上Kmeans聚类算法的案例，图片处理与NBA群员信息的分析。 Kmeans算法是非监督的学习里面的一个经典算法，也是一个典型的基于距离的非层次聚类算法，在小化误差函数的基础上，将数据划分为预定的类数K(这个k我们稍后说)，采用距离作为相似性的评价指标，及认为俩个对象的距离越近，其相似度越高。可能大家有点懵，这个Kmeans到底是什么呢，其实他就是我们的扎堆算法(...

一些用于聚类和分类问题的数据集