制作tensorflow数据集

本文介绍了如何将图片数据集转换为TensorFlow的TFRecord格式,利用cifar10的五个类别(bird, car, cat, deer, plane)作为示例。通过创建和写入TFRecord文件,加快数据处理速度。代码详细展示了如何组织数据、生成protobuf二进制文件,并进行数据切分、写入和验证。" 95447201,8676148,使用Tensorflow的VGG16模型训练CIFAR10,"['深度学习', '图像识别', 'Tensorflow模型', '卷积神经网络', '数据预处理']
摘要由CSDN通过智能技术生成

1首先准备好自己图片数据集,我是用cifar10 的其中五个类别,分别是bird,car ,cat,deer,plane。五个类别数据分开放置。例如:


然后就是根据数据集生成tfrecord,生成的是protobuf(二进制文件,加速文件传输和处理速度),代码如下

<

import tensorflow as tf

import os

import random
import math
import sys
#验证集数量
_NUM_TEST = 500
#随机种子
_RANDOM_SEED = 0
#数据块
_NUM_SHARDS = 5
#数据集路径
DATASET_DIR = "D:/Tensorflow/slim/images/"
#标签文件名字
LABELS_FILENAME = "D:/Tensorflow/slim/images/labels.txt"

#定义tfrecord文件的路径+名字
def _get_dataset_filename(dataset_dir, split_name, shard_id):
    output_filename = 'image_%s_%05d-of-%05d.tfrecord' % (split_name, shard_id, _NUM_SHARDS)
    return os.path.join(dataset_dir, output_filename)

#判断tfrecord文件是否存在
def _dataset_exists(dataset_dir):
    for split_name in ['train', 'test']:
        for shard_id in range(_NUM_SHARDS):
            #定义tfrecord文件的路径+名字
            output_filename = _get_dataset_filename(dataset_dir, split_name, shard_id)
        if not tf.gfile.Exists(output_filename):
            return False
    return True

#获取所有文件以及分类
def _get_filenames_and_classes(d

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值