分类任务数据集制作

本文详细介绍了如何整理图像数据集,将其按类别组织,并利用转换程序转化为适用于深度学习模型训练的格式,如.pkl文件。通过这样的预处理步骤,可以便捷地批量读取数据,加速图像分类任务的进行。
摘要由CSDN通过智能技术生成

众所周知,在深度学习图像分类、目标检测等任务的训练过程中需要大量的训练图片;为了方便快速批量的读取数据,往往都会先把图片数据集转化成特殊的文件格式,常见的如:.mat, .npy, .pkl, .csv 等。本文主要介绍如何由现有图片生成.pkl文件。

图片的整理

首先,将图片按类别整理成如下目录格式:
- 第一层目录为/jpg
- 第二层目录如图
这里写图片描述
显然每个文件夹下放的是各类的图片。

转换程序

# img2pkl.py
from __future__ import division, print_function, absolute_import
import os
import sys
# import tarfile
import numpy as np
import pickle
import random
from PIL import Image

# 主要函数接口
def load_data(dirname="17flowers", pklpath='17flowers/jpg/',
                resize_pics=(224, 224), shuffle=True, one_hot=False):

    dataset_file = os.path.join(dirname, 'dataset.pkl')
    X, Y = build_image_dataset_from_dir(directory=pklpath,
                                        dataset_file=dataset_file,
                                        resize=resize_pics,
                                        filetypes=['.jpg', '.jpeg'],
                                        convert_gray=False,
                                        shuffle_data=shuffle,
                                        categorical_Y=one_hot)

    return X, Y

###
  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值