内容
1.下载数据集
2.可视化数据集
3.ConvnetJS-demo
1.下载数据集
学习深度学习时,需要大量的样本作为支撑,自己找既费时有费精力,搜集的图片还需要进一步做处理,这个工作量也是非常大的。因此,直接使用专门团队做到的数据集,是一个不错的选择。CIFAR的具体由来请参照:https://www.cnblogs.com/neopenx/p/4480701.html.改研究团队提供了10分类的cifar10和4分类的cifar4,大家可以根据自己需要自行下载。
CIFAR的数据集官网提供了不同系统Python、metlab等不同语言的的版本可供下载,连接如下:http://www.cs.toronto.edu/~kriz/cifar.html
从网上下载该数据集,如下载cifar10-python.tar.gz文件,解压包含如下文件:
文件名称 文件大小
data_batch_1.bin 30010KB
data_batch_2.bin 30010KB
data_batch_3.bin 30010KB
data_batch_4.bin 30010KB
data_batch_5.bin 30010KB
test_batch.bin 30010KB
其中 data_batch_1.bin、data_batch_2.bin、data_batch_3.bin、data_batch_4.bin、data_batch_5.bin是训练集,test_batch.bin是测试集。
2.可视化数据集
下载解压后的数据集是通过pickle模块进行处理的,是无法看到里面的图片长什么样的,如图1所示。为了能够看到数据集长什么样的,满足初学者的好奇心,需要反pickle操作,在做可视化处理。