制作自己的TFRecord数据集

最新推荐文章于 2024-06-06 14:27:47 发布

吃了亏还皮

最新推荐文章于 2024-06-06 14:27:47 发布

阅读量609

点赞数

分类专栏： TensorFlow 胶囊神经网络文章标签：胶囊神经网络 Capsules

本文链接：https://blog.csdn.net/qq_18483627/article/details/81671431

版权

TensorFlow 同时被 2 个专栏收录

13 篇文章 4 订阅

订阅专栏

胶囊神经网络

3 篇文章 0 订阅

订阅专栏

一直在做CNN图像分类，原来采用的图像读入方式是放到文件夹下，直接将数据加载进内存，然后再分batch输入网络进行训练，但是后来发现太占用内存了，加了新内存条还是不够用。查阅资料，原来使用TFRecords这种结构能够有效地节省内存空间。

下面就来制作自己的数据集吧！找到10类电商图像，调整和mnist类似，单通道，28x28大小。数据路径为D:\data\TFRecord

import cv2  
import numpy as np 
import os
import os.path
import sys

def suoxiao(image):
    img=cv2.imread(image)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    pic = cv2.resize(img, (28, 28), interpolation=cv2.INTER_CUBIC)
    
    tempName=os.path.splitext(image)[0]
    tempName=tempName.split("/")[-1]
    tempName = tempName+"_x3.jpg"
    cv2.imwrite(tempName,pic)

if __name__ == "__main__":
    for tempImg in os.listdir("D:\\data\\TFRecord\\pixie"):
        tempImg = "D:\\data\\TFRecord\\pixie\\"+tempImg
        suoxiao(tempImg)

TFRecord是一种将图像数据和标签放在一起的二进制文件，能更好的利用内存。会根据你选择输入文件的类，自动给每一类打上同样的标签。

import os 
import tensorflow as tf 
from PIL import Image  
import matplotlib.pyplot as plt 
import numpy as np
 
cwd='D:\\data\\TFRecord\\'
classes={'banshenqun','duanku','gaogenxie','lianyiqun','niuzaiku'
         ,'pixie','piyi','xizhuang','yezi','yurongfu'} 
writer= tf.python_io.TFRecordWriter("mnist.tfrecords") 
 
for index,name in enumerate(classes):
    class_path=cwd+name+'\\'
    for img_name in os.listdir(class_path): 
        img_path=class_path+img_name 
 
        img=Image.open(img_path)
        img_raw=img.tobytes()
        example = tf.train.Example(features=tf.train.Features(feature={
            "label": tf.train.Feature(int64_list=tf.train.Int64List(value=[index])),
            'img_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw]))
        })) 
        writer.write(example.SerializeToString())  
 
writer.close()

然后会生成一个mnist.tfrecords文件，制作完毕。

吃了亏还皮

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
制作自己的TFRecord数据集

一直在做CNN图像分类，原来采用的图像读入方式是放到文件夹下，直接将数据加载进内存，然后再分batch输入网络进行训练，但是后来发现太占用内存了，加了新内存条还是不够用。查阅资料，原来使用TFRecords这种结构能够有效地节省内存空间。下面就来制作自己的数据集吧！找到10类电商图像，调整和mnist类似，单通道，28x28大小。数据路径为D:\data\TFRecordimport...
复制链接

扫一扫

专栏目录