python如何读取tfrecord_TFRecords文件的生成和读取(1)

本文详细介绍了如何使用Python创建和读取TFRecord文件,包括建立存储器、构造Example模块,以及使用TFRecordWriter和TFRecordReader进行读写操作。通过示例代码,展示了如何将图片数据和标签转换为TFRecord格式,并提供了多个实际例子,如从MNIST数据集生成TFRecord文件以及如何读取和处理这些文件。
摘要由CSDN通过智能技术生成

参考:https://blog.csdn.net/u012222949/article/details/72875281

参考:https://blog.csdn.net/chengshuhao1991/article/details/78656724

参考:https://zhuanlan.zhihu.com/p/27238630

tfrecords文件的存储:

将其他数据存储为tfrecord文件的时候,需要进行两个步骤:

建立tfrecord存储器

构造每个样本的Example模块

1、构建tfrecord存储器

实现建立存储器的函数为:

tf.python_io.TFRecordWriter(path)#写入tfrecord文件#path为tfrecord的存储路径

2、构造每个样本的example模块

Example协议块的规则如下:

message Example {

Features features= 1;

};

message Features {

map feature = 1;

};

message Feature {

oneof kind {

BytesList bytes_list= 1;

FloatList float_list= 2;

Int64List int64_list= 3;

}

};

其中实现的几个函数如下所示:

def_int64_feature(value):return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))

tf.train.Example(features=tf.train.Features(feature={'i':_int64_feature(1),'j':_int64_feature(2)}))

#或者直接写成

tf.train.Example(features=tf.train.Features(feature={'i':tf.train.Feature(int64_list=tf.train.Int64List(value=[1])),'j':tf.train.Feature(int64_list=tf.train.Int64List(value=[2]))}))#返回结果如下

features {

feature {

key:"i"value {

int64_list {

value:1}

}

}

feature {

key:"j"value {

int64_list {

value:2}

}

}

}

tf.train.Example(features =None)#用于写入tfrecords文件#features : tf.train.Features类型的特征实例#返回example协议格式块

tf.train.Features(feature =None)#用于构造每个样本的信息键值对#feature : 字典数据,key为要保存的名字,value为tf.train.Feature实例#返回Features类型

tf.train.Feature(**options)#options可选的三种数据格式:

bytes_list = tf.train.BytesList(value =[Bytes])

int64_list= tf.train.Int64List(value =[Value])

float_list= tf.trian.FloatList(value = [Value])

writer=tf.python_io.TFRecordWriter(filename)

example=tf.train.Example(features=tf.train.Features(feature={'i':_int64_feature(i),'j':_int64_feature(j)}))

writer.write(example.SerializeToString()) #序列转换成字符串

#如上读文件与如下写文件对应

filename_queue=tf.train.string_input_producer(files,shuffle=False) #传入文件名list,系统将其转化为文件名queue

reader=tf.TFRecordReader()

_,serialized=reader.read(filename_queue)

features=tf.parse_single_example(serialized,features={'i':tf.FixedLenFeature([],tf.int64),'j':tf.FixedLenFeature([],tf.int64)}) #tf.TFRecordReader()的parse_single_example()解析器,用于将Example协议内存块解析为

Python读取TFRecord文件的方法如下: ```python import tensorflow as tf # 创建一个TFRecordDataset对象 dataset = tf.data.TFRecordDataset('data.tfrecord') # 定义读取函数 def parser(record): features = { 'image': tf.io.FixedLenFeature([], dtype=tf.string), 'label': tf.io.FixedLenFeature([], dtype=tf.int64) } parsed = tf.io.parse_single_example(record, features) image = tf.io.decode_jpeg(parsed['image'], channels=3) label = parsed['label'] return image, label # 应用读取函数到每个record dataset = dataset.map(parser) # 创建迭代器 iterator = dataset.make_one_shot_iterator() # 获取数据 image, label = iterator.get_next() ``` 以上代码演示了如何读取名为`data.tfrecord`的TFRecord文件,并解析其中的图像和标签信息。在解析函数`parser`中,我们先定义了TFRecord文件中包含的特征信息,然后使用`tf.io.parse_single_example`函数解析单个record,并对图像数据进行解码。最后,我们使用`map`函数将解析函数应用到每个record上。 当然,如果您使用的是PyTorch,也可以使用以下代码读取TFRecord文件: ```python import torch import torchvision.datasets as datasets import torchvision.transforms as transforms # 定义解析函数 def parser(record): features = { 'image': tf.io.FixedLenFeature([], dtype=tf.string), 'label': tf.io.FixedLenFeature([], dtype=tf.int64) } parsed = tf.io.parse_single_example(record, features) image = tf.io.decode_jpeg(parsed['image'], channels=3) label = parsed['label'] return image, label # 创建数据集对象 dataset = datasets.DatasetFolder( 'data.tfrecord', loader=lambda x: torch.load(x), extensions=('tfrecord') ) # 应用解析函数到每个record dataset.transform = transforms.Compose([ parser ]) # 创建数据加载器 dataloader = torch.utils.data.DataLoader( dataset, batch_size=32, shuffle=True ) # 获取数据 for images, labels in dataloader: # 使用数据进行训练或预测 pass ``` 以上代码演示了如何使用PyTorch的`DatasetFolder`读取TFRecord文件,并使用解析函数`parser`解析图像和标签信息。最后,我们创建了一个数据加载器,并使用其中的数据进行训练或预测。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值