Cifar10 包含十类图片, 共 60000 个 32*32 的colour images,每一类有 6000 个 images。其中,训练集包含 50000 张,测试集为 10000张。
它的 binary version 文件包含如下几个文件:
batch 1-5 是训练集,test_batch 是测试集
每一个 binary 文件都包含如下的内容:
其中,第一个 byte 是第一个 image 的 label,是 0-9 的数字,之后的 3072 byte 是这个 image 的 pixels 的值,这 3072 的 byte 中,前 1024 是 red channel,接下来 1024 是 green,然后是 blue,以 row-major order 保存
每一个 binary 包含 10000 个 imgage
import os
import caffe
import numpy as np
import lmdb
#cifar10 bin文件路径
cifar_directory = os.path.abspath("/home/shuai/cifar10/cifar10_data/cifar-10-batches-bin")
#train_lmdb的路径,如果不存在,会创建文件夹