作为主流的分类数据集,这一篇主要讲 CIFRA-10 与 CIFRA-100 数据集下载与Python版本的处理
数据集下载地址:http://www.cs.toronto.edu/~kriz/cifar.html
数据介绍
CIFAR-10和CIFAR-100是两组有8000万个微小图像数据组成的标记图片数据集。它们是由Alex Krizhevsky,Vinod Nair和Geoffrey Hinton(大佬大佬大佬)收集的。
CIFAR-10数据集
CIFAR-10数据集由10个类(‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’)共60000个32x32彩色图像组成,每个类有6000个图像。被划分为50000个训练图像和10000个测试图像。
数据集分为五个训练批次(data_batch)和一个测试批次(test_batch),每个批次有10000个图像。测试批次包含来自每个类别的1000个随机选择的图像。训练批次以随机顺序包含剩余图像,但是一些训练批次可能包含来自一个类别的更多图像而不是另一个类别。在它们之间,训练批次包含来自每个类别的5000个图像。