1.mnist数据集
训练集:60000张灰色图像,大小28*28,共10类(0-9)
测试集:10000张灰色图像,大小28*28
from keras.datasets import mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test: 参数规格分别为(60000, 28, 28)和(10000, 28, 28)。
y_train, y_test: 数字标签(0-9),参数规格分别为(60000,)和(10000,)
数据下载地址:http://yann.lecun.com/exdb/mnist/
2.CIFAR-10数据集
CIFAR-10来自于80 million张小型图片的数据集,如下:
总数 | 色彩 | 图片尺寸 | 类别数 | 训练集 | 测试集 |
60000张 | RGB | 32*32 | 10类 | 50000张 | 10000张 |
整个数据集被分为5个training batches和1个test batch。test batch:随机从每类选择10000张图片组成,training batches:从剩下的图片中随机选择,但每类的图片不是平均分给batch的,总数为50000张图片,这些类别是完全互斥的。
数据下载链接:http://www.cs.toronto.edu/~kriz/cifar.html
解压后的文件包括:
下面是python3来打开文件,每个batch文件转换为dictonary:
def unpickle(file):
import pickle
with open(file, 'rb&#