主要是试着使用一下cifar-10数据集,cifar-10数据集为60000张32*32*3的彩色图片,总共有10个类别,其中50000张训练集,10000张测试集。
下载地址:http://www.cs.toronto.edu/~kriz/cifar.html
代码与google的例子和网上的版本大致相同,主要的区别是使用了cifar10的python版数据,自己写了一个读取和随机抽取数据的程序,网上的版本大多使用google的例子中的cifar10_input.py下的输入函数,会进行数据增强,自己手写的没有数据增强,google例子中使用Session读取数据我跑的时候会卡住,网上说Session效率极低。
下面先给出这部分的代码,我将读取数据相关的程序写在了input.py中
import pickle
import numpy as np
import random
def load(file_name):
with open(file_name, 'rb') as fo:
data = pickle.load(fo, encoding='bytes')
return data
def get_train():
data1 = load('D:\IDE\Project\Pycharm_Project\Cifar10_Project\cifar-10-batches-py\data_batch_1')
x1 = np.array(data1[b'data'])
x1 = x1.reshape(-1, 32, 32, 3)
y1 = np.array(data1[b'labels'])
data2 = load('D:\IDE\Project\Pycharm_Project\Cifar10_Project\cifar-10-batches-py\data_batch_2')
x2 = np.array(data2[b'data'])
x2 = x2.reshape(-1, 32, 32, 3)
y2 = np.array(data2[b'labels'])
train_data = np.r_[x1, x2]
train_labels = np.r_[y1, y2]
data3 = load('D:\IDE\Project\Pycharm_Project\Cifar10_Project\cifar-10-batches-py\data_batch_3')
x3 = np.array(data3[b'data'])
x3 = x3.reshape(-1, 32, 32, 3)