Tensorflow分批量读取数据

最新推荐文章于 2024-08-19 11:48:56 发布

freedom098

最新推荐文章于 2024-08-19 11:48:56 发布

阅读量8.5k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/freedom098/article/details/56013625

版权

本文介绍了在TensorFlow中如何实现分批量读取数据，通过tf.train.shuffle_batch函数创建一个蓄水池，用于存储数据并随机生成batch。读取数据和解码过程与之前类似，关键在于设置好batch_size、capacity、min_after_dequeue和num_threads等参数，以确保随机性和性能的平衡。

摘要由CSDN通过智能技术生成

Tensorflow分批量读取数据

之前的博客里使用tf读取数据都是每次fetch一条记录，实际上大部分时候需要fetch到一个batch的小批量数据，在tf中这一操作的明显变化就是tensor的rank发生了变化，我目前使用的人脸数据集是灰度图像，因此大小是92*112的，所以最开始fetch拿到的图像数据集经过reshape之后就是一个rank为2的tensor，大小是92*112的（如果考虑通道，也可以reshape为rank为3的，即92*112*1）。如果加入batch，比如batch大小为5，那么拿到的tensor的rank就变成了3，大小为5*92*112。

下面规则化的写一下读取数据的一般流程，按照官网的实例，一般把读取数据拆分成两个大部分，一个是函数专门负责读取数据和解码数据，一个函数则负责生产batch。

import tensorflow as tf

def read_data(fileNameQue):

    reader = tf.TFRecordReader()
    key, value = reader.read(fileNameQue)
    features = tf.parse_single_example(value, features={
  <