tf.train.slice_input_producer()、tf.train.batch()、tf.train.shuffle_batch()函数

最新推荐文章于 2020-06-12 21:58:44 发布

kudou1994

最新推荐文章于 2020-06-12 21:58:44 发布

阅读量364

点赞数 1

分类专栏： # 代码/源码 Tensorflow Transformer

本文链接：https://blog.csdn.net/kudou1994/article/details/98477149

版权

Tensorflow利用slice_input_producer创建文件名队列，tf.train.batch按顺序出队数据，shuffle_batch实现乱序出队。文件名队列在每个epoch结束后抛出OutOfRange异常，slice_input_producer参数包括tensor_list、num_epochs、shuffle等。tf.train.batch处理batch_size、num_threads、capacity等，shuffle_batch关注min_after_dequeue确保数据混合。

摘要由CSDN通过智能技术生成

Tensorflow的数据读取机制：

tensorflow中为了充分利用GPU，减少GPU等待数据的空闲时间，使用了两个线程分别执行数据读入和数据计算。
具体来说就是使用一个线程源源不断的将硬盘中的图片数据读入到一个内存队列中，另一个线程负责计算任务，所需数据直接从内存队列中获取。
tf在内存队列之前，还设立了一个文件名队列，文件名队列存放的是参与训练的文件名，要训练 N个epoch，则文件名队列中就含有N个批次的所有文件名。
在N个epoch的文件名最后是一个结束标志，当tf读到这个结束标志的时候，会抛出一个 OutofRange 的异常，外部捕获到这个异常之后就可以结束程序了。而创建tf的文件名队列就需要使用到 tf.train.slice_input_producer 函数。
在这里插入图片描述

slice_input_producer() 创建文件名队列

slice_input_producer(tensor_list, num_epochs=None, shuffle=False, seed=None,
                         capacity=32, shared_name=None, name=None)

tensor_list：包含一系列tensor的列表，表中tensor的第一维度的值必须相等，即个数必须相等，有多少个数据，就应该有多少个对应

最低0.47元/天解锁文章

kudou1994

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录