1、CIFAR-10,是一个用于做图像分类研究的数据集。
由60000个图片组成
6万个图片中,5万张用于训练,1万张用于测试
每个图片是32x32像素
所有图片可以分成10类
每个图片都有一个标签,标记属于哪一个类
测试集中一个类对应1000张图
训练集中将5万张图分为5份
类之间的图片是互斥的,不存在类别重叠的情况
下图展示了具体的分类,
2、 数据集加载:
CIFAR-10提供了三个版本的数据格式:python,matlab,二进制 。
from __future__ importprint_functionfrom six.moves importcPickle as pickleimportnumpy as npimportosfrom scipy.misc importimreadimportplatform#读取文件
defload_pickle(f):
version= platform.python_version_tuple() #取python版本号
if version[0] == '2':return pickle.load(f) #pickle.load, 反序列化为python的数据类型
elif version[0] == '3':return pickle.load(f, encoding='latin1')raise ValueError("invalid python version: {}".format(version))defload