1. tf.data.FixedLengthRecordDataset
这个函数的输入是一个文件的列表和一个record_bytes,之后dataset的每一个元素就是文件中固定字节数record_bytes的内容。通常用来读取以二进制形式保存的文件,如CIFAR10数据集就是这种形式。
cifar10的record_bytes等于=height*width*channel+1
① tf.data.FixedLengthRecordDataset.prefetch(buffer_size):
预先加载一部分数据
② tf.data.FixedLengthRecordDataset.shuffle(buffer_size, seed=None, reshuffle_each_iteration=None)
随机打乱数据集
③ tf.data.FixedLengthRecordDataset.repeat (count=None)
重复数据集count次,比如说数据集要训练n个epochs,count=n
④ tf.data.FixedLengthRecordDataset.take(count)
取count个样本
⑤ tf.data.FixedLengthRecordDataset.map(map_func, num_parallel_calls=None)
2.