深度学习中使用的数据集介绍

本文介绍了几个深度学习中常用的数据集,包括mnist、CIFAR-10、CIFAR-100、SVHN和fashion_mnist。详细说明了每个数据集的特征、图像尺寸、标签类型以及数据分布,并提供了数据下载链接。这些数据集对于训练和验证各种计算机视觉任务的模型至关重要。
摘要由CSDN通过智能技术生成

1.mnist数据集

训练集:60000张灰色图像,大小28*28,共10类(0-9)

测试集:10000张灰色图像,大小28*28

from keras.datasets import mnist
 
(x_train, y_train), (x_test, y_test) = mnist.load_data()

x_train, x_test: 参数规格分别为(60000, 28, 28)和(10000, 28, 28)。
y_train, y_test: 数字标签(0-9),参数规格分别为(60000,)和(10000,)

数据下载地址:http://yann.lecun.com/exdb/mnist/
 

2.CIFAR-10数据集

CIFAR-10来自于80 million张小型图片的数据集,如下:

总数 色彩 图片尺寸 类别数 训练集 测试集
60000张 RGB 32*32 10类 50000张 10000张

整个数据集被分为5个training batches和1个test batch。test batch:随机从每类选择10000张图片组成,training batches:从剩下的图片中随机选择,但每类的图片不是平均分给batch的,总数为50000张图片,这些类别是完全互斥的。

数据下载链接:http://www.cs.toronto.edu/~kriz/cifar.html

解压后的文件包括:


下面是python3来打开文件,每个batch文件转换为dictonary:

def unpickle(file):
    import pickle
    with open(file, 'rb&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值