d# 一、tfrecords是什么
tfrecords是一种二进制编码的文件格式,tensorflow专用。
能将任意数据转换为tfrecords。
更好的利用内存,更方便复制和移动,并且不需要单独的标签文件。
二、使用
1、 将数据保存为tfrecords
TFRecords
文件包含了tf.train.Example
协议内存块(protocol buffer
)(协议内存块包含了字段 Features
)。我们可以写一段代码获取你的数据, 将数据填入到Example
协议内存块(protocol buffer
),将协议内存块序列化为一个字符串, 并且通过tf.python_io.TFRecordWriter
写入到TFRecords
文件。
流程:
1. 将数据填入example protocol buffer
2. 将protocol buffer
序列化为一个字符串
3. 通过tf.python_io.TFRecordWriter
将字符串写入TFRecords
文件
# 将数据转化成对应的属性
def _bytes_feature(value):
# 字符串列表类型作为feature的value
return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))
def _int64_feature(value):
# 整数列表类型作为feature的value
return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))
def _float_feature(value):
return tf.train.Feature(float_list=tf.train.FloatList(value=[value]))
writer=tf.python_io.TFRecordWriter('filename') # 初始化一个writer
example=tf.train.Example(
features=tf.train.Features(
feature={
"name": _bytes_feature('xianyi'),
"age": _int64_feature(23)
}
)
) # 填充数据,example填充features,features填充feature,feature填写key和value,value是tf.train.Feature(类型=tf.train.类型(value=[value]))
writer.write(example.SerializeToString()) # 将序列化的example写入文件
这个写入example
的过程有点复杂。
Example
,初始化为tf.train.Example()
包含字段features=tf.train.Features()
字段features
包含一个或多个: feature={"key": tf.train.Feature()}
feature
是基于key-value
对的存储,key
是字符串,其映射到的是value
包含3种数据类型:
1. BytesList
: 字符串列表: tf.train.BytesList(value=[value])
2. FloatList:
浮点数列表tf.train.FloatList()
3. Int64List
: 64位整数列表tf.train.Int64List()
对于图片的numpy数组,可以.tostring之后存到BytesList,可以tf.gfile.FastGFile读入成bytes存到BytesList,可以.flatten后存到FloatList
Example
中有几个一致性规则需要注意:
1. 如果一个example
的feature K
的数据类型是T
,那么所有其他的所有feature K
都应该是这个数据类型
2. feature K
的value list
的item
个数可能在不同的example中
是不一样多的,这个取决于你的需求
3. 如果在一个example
中没有feature k
,那么如果在解析的时候指定一个默认值的话,那么将会返回一个默认值
4. 如果一个feature k
不包含任何的value
值,那么将会返回一个空的tensor
而不是默认值
一个example的例子:
features {
feature {
key: "age"
value { float_list {
value: 29.0
}}
}
feature {
key: "movie"
value { bytes_list {
value: "The Shawshank Redemption"
value: "Fight Club"
}}
}
feature {
key: "