神经网络训练图片数据集读取方法——h5py(python)
又学习另一种方法存储图片数据集——h5py
什么是h5py?
h5py文件是存放两类对象的容器,数据集(dataset)和组(group),dataset类似数组类的数据集合,和numpy的数组差不多。group是像文件夹一样的容器,它好比python中的字典,有键(key)和值(value)。group中可以存放dataset或者其他的group。”键”就是组成员的名称,”值”就是组成员对象本身(组或者数据集)。
程序:
#coding:utf-8
# 作者:chenqidan
import os
import numpy as np
from PIL import Image
import tensorflow as tf
import matplotlib.pyplot as plt
import sklearn
from sklearn import preprocessing
import h5py
import scipy
def get_files(file_dir):
a = [] #a,b,c,d分别是图片类数,自己记得替换掉
label_a = []
b = []
label_b = []
c = []
label_c = []
d = []
label_d = []
for file in os.listdir(file_dir + '/a'):