常用数据集
Iris数据集(鸢尾花数据集)
是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
MushRoom数据集(蘑菇数据集)
https://archive.ics.uci.edu/ml/datasets/Mushroom
该数据集包括与蘑菇和Lpiota科23种鳃蘑菇相对应的假设样本的描述(第500-525页)。每个物种被确定为绝对可食用,绝对有毒,或未知的可食用性,不推荐。后一类是与有毒的结合起来的。
Bostom Housing数据集(波士顿房价数据集)
介绍:https://www.cs.toronto.edu/~delve/data/boston/bostonDetail.html
该数据集包含美国人口普查局收集的有关波士顿地区住房的信息。它是从StatLib档案中获得的(Http://lib.stat.cmu.edu/datasets/boston),并在整个文献中广泛应用于对算法进行基准测试。然而,这些比较主要是在钻研因此有点可疑。数据集很小,只有506个案例。
Linnerrud 数据集
Linnerrud 数据集包含两个小的数据集:
运动: 一个包含以下内容的列表:运动数据,关于3个运动相关变量的20个观测值:体重,腰围和脉搏。生理: 一个包含以下内容的数据表:生理数据,关于三个生理变量的20个观测值:下巴,仰卧起坐和跳跃。
MINST数据集
官网:http://yann.lecun.com/exdb/mnist/
下载:https://hyper.ai/datasets/4923
MNIST数据集是机器学习领域中非常经典的一个数据集,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图