python从cifar-10-batches-py生成包含图片的cifar10数据集

路径记得按照自己的修改一下:

#encoding:utf-8
from cv2 import imwrite as imsave
import numpy as np
import os 

# 解压缩,返回解压后的字典
def unpickle(file):
    import pickle
    with open(file, 'rb') as fo:
        dicts = pickle.load(fo, encoding='bytes')
    return dicts
#创建文件夹
date_dict = {0:"airplane",1:"automobile",2:"bird",3:"cat",4:"deer",5:"dog",6:"frog",7:"horse",8:"ship",9:"truck"}
for i in range(len(date_dict)):
    path1 = f"/root/cifar-10/train/{date_dict[i]}"
    path2 = f"/root/cifar-10/test/{date_dict[i]}"
    if not os.path.isdir(path1):
        os.makedirs(path1)
    if not os.path.isdir(path2):
        os.makedirs(path2)    

#生成训练集图片,如果需要jpg格式,只需要改图片后缀名即可。
for j in range(1, 6):
    dataName = "/root/cifar-10-batches-py/data_batch_" + str(j)  # 读取当前目录下的data_batch12345文件,dataName其实也是data_batch文件的路径,本文和脚本文件在同一目录下。
    Xtr = unpickle(dataName)
    print(dataName + " is loading...")

    for i in range(0, 10000):
        img = np.reshape(Xtr[b'data'][i], (3, 32, 32))  # Xtr['data']为图片二进制数据
        img = img.transpose(1, 2, 0)  # 读取image
        picName = '/root/cifar-10/train/' + str(date_dict[Xtr[b'labels'][i]])+"/"+str(i + (j - 1)*10000) + '.png'  # Xtr['labels']为图片的标签,值范围0-9,本文中,train文件夹需要存在,并与脚本文件在同一目录下。
        imsave(picName, img)
    print (dataName + " loaded.")

print("test_batch is loading...")

# 生成测试集图片
testXtr = unpickle("/root/cifar-10-batches-py/test_batch")
for i in range(0, 10000):
    img = np.reshape(testXtr[b'data'][i], (3, 32, 32))
    img = img.transpose(1, 2, 0)
    picName = '/root/cifar-10/test/' + str(date_dict[testXtr[b'labels'][i]]) + '/' + str(i) + '.png'
    imsave(picName, img)
print("test_batch loaded.")
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值