Python将自己的图片数据集导入h5py，做识别的预处理

最新推荐文章于 2024-07-26 09:15:09 发布

chenkz123

最新推荐文章于 2024-07-26 09:15:09 发布

阅读量1.7w

点赞数 16

文章标签： python Deep Learning

本文链接：https://blog.csdn.net/chenkz123/article/details/79640658

版权

本文介绍了如何在训练卷积神经网络时，利用Python将个人图片数据集有效地导入h5py文件，以减少存储空间并方便后续的深度学习识别任务。具体步骤包括组织图片数据集，如将图片按类别分放在不同文件夹中。

摘要由CSDN通过智能技术生成

很多情况下，在训练卷积神经网络时，需要将自己的图片作为卷积神经网络的输入。

将自己的图片数据集导入h5py，所占空间小，使用方便

条件：自己的图片，eg:cats VS dogs,并将两类图片分别放置于两个文件夹（我这里是yes_tumble与not_tumble）

import os
import numpy as np
from PIL import Image
import tensorflow as tf
import matplotlib.pyplot as plt
import sklearn
from sklearn import preprocessing
import h5py
import scipy
#导入必要的包

def get_files(file_dir):
    cats = []
    label_cats = []
    dogs = []
    label_dogs = []
    
    for file in os.listdir(file_dir+'/not_tumble'):
            cats.append(file_dir +'/not_tumble'+'/'+ file) 
            label_cats.append(0)     #添加标签，该类标签为0，此为2分类例子，多类别识别问题自行添加
    for file in os.listdir(file_dir+'/yes_tumble'):
            do