图片转tfrecord格式的优化

博客讲述了在将图片转换为tfrecord格式时遇到的问题,原始方法导致转换后的文件大小是原始图片的9-10倍。作者探讨了两种方案:方案1是将图片转为numpy矩阵再保存为字符串,而方案2则是直接保存图片的二进制数据。方案2显著减少了文件大小并提高了读写速度,将505M的文件降至73M。
摘要由CSDN通过智能技术生成

前两天在用一个开源代码的时候,发现他把数据转tfrecord以后特别大,本来硬盘空间就有些紧张,这下更不够了。看了一下转完以后的大小,是原始数据的9、10倍,这就有些夸张了。之前用tfrecord的时候没有特别注意这个事情,这次看到了还是研究一下。

方案1:

这是原来代码里的写法,为了简便,就只挑重要部分的写了:

import tensorflow as tf
import numpy as np
import os,sys
import PIL.Image

def _int64_feature(value):
    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))

def _bytes_feature(value):
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))

def get_file_list(input_dir):
    res = []
    files = os.listdir(input_dir)
    for file in files:
        res.append(file)
    return res

def 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值