在涉及目标分类,深度学习理论的基本验证过程,会接触到两类基本的数据集,MNIST、CIFAR10和CIFAR100,熟悉了解这两类数据集的特性对后续的实验是十分重要的,本文主要介绍它们的区别,
基本介绍
MNIST:10类共70000张28x28的0-9的手写数字图片,每类有7000张图片,其中60000张为训练集,10000张为测试集。
CIFAR10:10类共60000张32x32彩色图像,每类有6000张图片,其中50000个训练集,10000张为测试集。
CIFAR100:100类共60000张32x32彩色图像,每类有600张图片,其中50000个训练集,10000张为测试集,共100类分为20个超类,所以每个图像都带有一个“精细”标签(它所属的类)和一个“粗”标签(它所属的超类)。
下载链接
MNIST : http://yann.lecun.com/exdb/mnist/
CIFAR10/100 : https://www.cs.toronto.edu/~kriz/cifar.html
难度比较
CIFAR100 > CIFAR10 > MNIST