TFRecoders

最新推荐文章于 2022-03-18 19:09:05 发布

rainbow_lucky0106

最新推荐文章于 2022-03-18 19:09:05 发布

阅读量174

点赞数

分类专栏： Python基础

Python基础专栏收录该内容

28 篇文章 0 订阅

订阅专栏

TFRecords文件读写

https://blog.csdn.net/u012222949/article/details/72875281/
https://blog.csdn.net/chengshuhao1991/article/details/78656724

统一不同输入文件的框架
更好的利用内存，更方便复制和移动（TFRecord压缩的二进制文件, protocal buffer序列化）
用于将二进制数据和标签（训练的类别标签）数据存储在同一个文件中

Protocol Buffer 协议缓冲区

tfrecord文件包含了tf.train.Example 协议缓冲区(protocol buffer，协议缓冲区包含了特征 Features)。可以写一段代码获取数据，将数据填入到Example协议缓冲区(protocol buffer)，将协议缓冲区序列化为一个字符串，并且通过tf.python_io.TFRecordWriter class写入到TFRecords文件。
内部使用**“Protocol Buffer”二进制数据编码**方案，只要生成一次TFRecord，之后的数据读取和加工处理的效率都会得到提高。
输入函数：数据集导入，返回两个对象（字典、包含一个或多个标签的tensor）

建立TFRecord存储器

write

向文件中写入一个字符串（序列化的Example）记录（即一个样本）。
序列化的Example,通过Example.SerializeToString()来实现，作用是将Example中的map压缩为二进制，节约大量空间。

# 创建一个writer来写 TFRecords 文件
writer = tf.python_io.TFRecordWriter(train_filename)

read

# 定义一个 reader ，读取下一个 record
reader = tf.TFRecordReader()
_, serialized_example = reader.read(filename_queue)

# 解析读入的一个record
features = tf.parse_single_example(serialized_example, features=feature)

Example协议块

tf.train.Example(features = None)

写入tfrecords文件
一般用于数值、图像等有固定大小的数据，同时使用tf.train.Feature指定每个记录各特征的名称和数据类型

tf.train.SequenceExample

一般用于文本、时间序列等没有固定长度大小的数据

tf.train.Features(feature = None)

构造每个样本的信息键值对

tf.train.Feature(**options)

options可以选择如下三种格式数据：
bytes_list = tf.train.BytesList(value = [Bytes])
int64_list = tf.train.Int64List(value = [Value])
float_list = tf.trian.FloatList(value = [Value])