小白一枚~
由于正在学习cs231n,第一节课就涉及到用这个数据集进行图像分类。该数据集的页面:http://www.cs.toronto.edu/~kriz/cifar.html
这篇随笔可以看作个人对于cifar数据集的介绍的中文版,Orz大佬勿嘲笑~~
/*************************************************************************************************************************************************************/
CIFAR-10和CIFAR-100是带有标签的数据集,都出自于规模更大的一个数据集,他有八千万张小图片(http://groups.csail.mit.edu/vision/TinyImages/。这个是一个大项目,你可以点击那个big map提交自己的标签,可以帮助他们训练让计算机识别物体的模型)
CIFAR-10
该数据集共有60000张彩色图像,这些图像是32*32,分为10个类,每类6000张图。这里面有50000张用于训练,构成了5个训练批,每一批10000张图;另外10000用于测试,单独构成一批。测试批的数据里,取自10类中的每一类,每一类随机取1000张。抽剩下的就随机排列组成了训练批。注意一个训练批中的各类图像并不一定数量相同,总的来看训练批,每一类都有5000张图。
下面这幅图就是列举了10各类,每一类展示了随机的10张图片:
屏幕剪辑的捕获时间: 2017/12/24 19:31