如何使用tensorflow加载cifar-10数据集

前言:最近写论文在celebA上训练之后,结果不错所以就在cifar-10数据继续训练数据集,但是在cifar-10官网上下载好数据之后,形式是:

cifar-10原始数据形式

上网上查了一下如何加载cifar-10的数据集,大神们各种方法都有,但是不是很懂里面原理,想想自己刚接触人工智能还是脚踏实地的分析一下,慢慢分析cifar-10的数据集吧, 所以以写一个小程序来实现cifar-10数据的读取,并且将其转化图像的形式放到不同类别的文件夹下。

程序主要实现的功能如下:

第一:把data_batch中的数据转化成numpy用来读取数据 

第二:把data_batch数据按照类别存到不同的文件夹下面,仅仅只做了一张数据,下一篇将所有的数据都转化成图像并且分类

程序主要分成两步:

第一:使用pickle加载数据集,并按照关键字找到所需要的数据集

第二:将numpy转化成图像的形式

开始秀代码: 代码写的有点乱 可以简单封装一下 方法定义一个函数, 然后根据需要设置返回值cifar_image cifar_label  cifar_image_name 其他的不需要修改

import pickle
import os
import numpy as np
import scipy.misc
from tqdm import tqdm

# 这段代码是cifar官网上给的 但是官网上给的解码方式是encoding='bytes'读数据会出问题  可以直接需改成encoding='latin1'
def unpickle(file):
    with open(file, 'rb') as f:
        cifar_dict = pickle.load(f, encoding='latin1')
    return cifar_dict


# 定义用来存放图像数据 图像标签 图像名称list  最后返回的cifar_image cifar_label即是图像cifar-10 对应的数据和标签
tem_cifar_image = []
tem_cifar_label = []
tem_cifar_image_name = []
size = 64
for i in range(1, 6):
    # 存放是你的文件对应的目录
    cifar_file = "../Dataset/cifar-10/data_batch_" + str(i)
    # print("确认一下目标文件是否正确",cifar_file)
    cifar =unpickle(cifar_file)
    # print("测试一下cifar的类型:", type(cifar), len(cifar['data']), cifar['batch_label'])
    cifar_label = cifar['labels']
    cifar_image = cifar['data']
    cifar_image_name = cifar['filenames']
    # 测试可知道cifar中存放四个信息 标签 图像的numpy数据  图像文件名称  batch_label
    # print("测试一下cifar_image[0], cifar_label[0], cifar_image_name[0]",cifar_image[0], cifar_label[0],cifar_image_name[0])
    # 使用transpose()函数是因为cifar存放的是图像标准是 通道数 高 宽 所以要修改成  高 宽 通道数
    cifar_image = cifar_image.reshape(10000, 3, 32, 32).transpose(0, 2, 3, 1).astype("float")
    cifar_image = np.asarray([scipy.misc.imresize(x_img, [size, size]) for x_img in cifar_image])
    cifar_label = np.array(cifar_label)
    cifar_image_name = np.array(cifar_image_name)
    tem_cifar_image.append(cifar_image)
    tem_cifar_label.append(cifar_label)
    tem_cifar_image_name.append(cifar_image_name)

# 之所以把数据进行连接一维是因为 不连接成维的话 后面将numpy转化成图像的时候不方便
# 有兴趣的可以试一下 提示一下 不执行np.concatenate() tem_cifar_image_name的形状是:(5 10000)
cifar_image = np.concatenate(tem_cifar_image)
print("cifar_image",type(cifar_image))
cifar_label = np.concatenate(tem_cifar_label)
cifar_image_name = np.concatenate(tem_cifar_image_name)
print("长度cifar_label",len(cifar_image))
'''
print(cifar_label[1])
print(cifar_image_name[1])
print(cifar_image[1])
'''


# 装化成图像 单元测试通过 下一篇将怎么把这些cifar-10存成图像的形式
a = "samples/"
scipy.misc.toimage(cifar_image[1], cmin=0.0, cmax=1.0).save('%s.jpg'%(a+cifar_image_name[1]))

 

 

  • 4
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: tensorflow cifar-10-batches-py是一个经典的深度学习数据集,被广泛用于图像分类任务的训练和评估。 该数据集CIFAR-10数据集的Python版本,提供了10个类别的60000个32x32彩色图像。其中,50000张图像作为训练集,10000张图像作为测试集。 这个数据集是用Python编写的,并且使用了pickle库来加载和处理数据。它可以通过执行"import cifar10"来导入,并使用"cifar10.load_data()"来加载其数据。 加载数据后,可以使用TensorFlow来构建一个图像分类模型。TensorFlow是一个开源的深度学习框架,可以用于构建、训练和评估机器学习模型。 使用tensorflow cifar-10-batches-py数据集,可以进行图像分类任务的实验和研究。可以结合卷积神经网络等深度学习模型,对图像进行特征提取和分类。 在训练模型时,可以使用训练集进行权重更新和优化,然后使用测试集来评估模型的性能。 总结来说,tensorflow cifar-10-batches-py是一个常用的深度学习数据集,可以用于图像分类任务的研究和实验。它结合了TensorFlow框架,提供了加载、处理和评估数据的功能。通过使用它,可以建立一个自定义的图像分类模型,并对其进行训练和评估。 ### 回答2: tensorflow cifar-10-batches-py是一个用于在tensorflow框架中处理CIFAR-10数据集的Python脚本。CIFAR-10数据集是一个广泛应用于图像分类的数据集,包含10个不同类别的影像数据,每个类别有6000个32x32大小的彩色图像。 这个Python脚本通过提供一些函数和类来加载CIFAR-10数据集,并且将图像和标签进行预处理,以便于在训练和测试模型时使用。脚本中的函数可以帮助我们将原始的二进制数据转换成可用于训练的张量形式。 该脚本提供的函数可以将CIFAR-10数据集分为训练集和测试集,并提供了一个函数用于获取下一个训练批或测试批的图像和标签。此外,该脚本还提供了一个函数用于显示CIFAR-10数据集中的图像。 使用tensorflow cifar-10-batches-py脚本,我们可以很方便地加载和预处理CIFAR-10数据集,并用于训练和测试图像分类模型。这个脚本是使用Python编写的,可以在tensorflow环境中直接使用。 ### 回答3: TensorFlowcifar-10-batches-py是一个用于训练和验证图像分类模型的数据集。它是基于CIFAR-10数据集的一个版本,其中包含50000张用于训练的图像和10000张用于验证的图像。 CIFAR-10数据集是一个常用的图像分类数据集,包含10个不同的类别,每个类别有大约6000张图像。这些类别包括:飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。每个图像的大小为32x32像素,是彩色图像。 cifar-10-batches-py数据集通过Python脚本cifar10.py提供,它将数据集分为5个训练批次和1个验证批次。在训练过程中,可以使用这些批次中的图像进行训练,并根据验证数据集的结果来评估模型的性能。 这个数据集提供了一个方便的方式来测试和评估不同的图像分类算法和模型。使用TensorFlowcifar10.py脚本可以加载这个数据集,并提供一些函数,用于解析和处理图像数据。 在使用cifar-10-batches-py数据集进行训练时,通常会将图像数据进行预处理,例如将像素值进行归一化处理,以便于模型的训练。同时,还可以使用数据增强的技术,如随机翻转、旋转或裁剪图像,以增加数据的多样性。 总的来说,TensorFlowcifar-10-batches-py数据集是为了方便机器学习研究人员进行图像分类模型训练和验证而提供的一个常用数据集。它可以用于测试和评估不同的图像分类算法和模型的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值