cifar10数据集测试有多少张图_CIFAR-10 dataset 的下载与使用

CIFAR-10数据集包含60000张32*32彩色图片,分为10个类别。50000张用于训练,10000张用于测试。数据集由data_batch_1到data_batch_5(每个含10000张训练图)和test_batch(10000张测试图)组成。使用pickle读取文件,data字段为10000*3072数组,labels字段存储类别标签,filenames字段记录图片名。
摘要由CSDN通过智能技术生成

基本信息

CIFAR-10 是一个包含60000张图片的数据集。其中每张照片为32*32的彩色照片,每个像素点包括RGB三个数值,数值范围 0 ~ 255。

所有照片分属10个不同的类别,分别是 'airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck'

其中五万张图片被划分为训练集,剩下的一万张图片属于测试集。

下载数据集

打开下面的链接进入官网下载

下载完成后先解压缩,之后会得到如下几个文件

data_batch_1 ~ data_batch_5 是划分好的训练数据,每个文件里包含10000张图片,test_batch 是测试集数据,也包含10000张图片。他们的结构是一样的,下面就用 data_batch_1 作为例子进行说明。

读取数据

importpickledefload_file(filename):

with open(filename,'rb') as fo:

data= pickle.load(fo, encoding='latin1')return data

首先定义读取数据的函数,这几个文件都是通过 pickle 产生的,所以在读取的时候也要用到这个包。

这里面返回的data是一个字典,先看看这个字典里面有哪些键吧。

data = load_file('test_batch')print(data.keys())

输出结果

dict_keys(['batch_label', 'labels', 'data', 'filenames'])

batch_label

对应的值是一个字符串,用来表明当前文件的一些基本信息。

如果是 data_batch_1 这个文件,里面的值就是

training batch 1 of 5

如果是 test_batch 这个文件,里面的值就是

testing batch 1 of 1

labels

对应的值是一个长度为10000的列表,每个数字取值范围 0~9,代表当前图片所属类别

data

10000 * 3072 的二维数组,每一行代表一张图片的像素值。(32*32*3=3072)

filenames

长度为10000的列表,里面每一项是代表图片文件名的字符串。

batches.meta 文件可以用相同的方法读取,里面存的是一些基本信息。

num_cases_per_batch

10000

label_names

['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

num_vis

3072

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值