tensorflow中 tf.train.slice_input_producer 和 tf.train.string_input_producer的区别

最新推荐文章于 2021-12-01 12:19:41 发布

小刘同学_

最新推荐文章于 2021-12-01 12:19:41 发布

阅读量625

点赞数

分类专栏： python 机器学习

本文链接：https://blog.csdn.net/SweetSeven_/article/details/103727438

版权

python 同时被 2 个专栏收录

35 篇文章 7 订阅

订阅专栏

机器学习

34 篇文章 2 订阅

订阅专栏

tensorflow数据读取机制

https://blog.csdn.net/SweetSeven_/article/details/103602828

之前的文章已经详细记录过了，这里介绍一下tensorflow中两个读取队列中tensor的函数的区别

tf.train.slice_input_producer

tf.train.slice_input_producer是一个tensor生成器，作用是按照设定，每次从一个tensor列表中按顺序或者随机抽取出一个tensor放入文件名队列。

slice_input_producer(tensor_list, num_epochs=None, shuffle=True, seed=None,
                         capacity=32, shared_name=None, name=None)

第一个参数 tensor_list：包含一系列tensor的列表，表中tensor的第一维度的值必须相等，即个数必须相等，有多少个图像，就应该有多少个对应的标签。
第二个参数num_epochs: 可选参数，是一个整数值，代表迭代的次数，如果设置 num_epochs=None,生成器可以无限次遍历tensor列表，如果设置为 num_epochs=N，生成器只能遍历tensor列表N次。
第三个参数shuffle： bool类型，设置是否打乱样本的顺序。一般情况下，如果shuffle=True，生成的样本顺序就被打乱了，在批处理的时候不需要再次打乱样本，使用 tf.train.batch函数就可以了;如果shuffle=False,就需要在批处理时候使用 tf.train.shuffle_batch函数打乱样本。
第四个参数seed: 可选的整数，是生成随机数的种子，在第三个参数设置为shuffle=True的情况下才有用。
第五个参数capacity：设置tensor列表的容量。
第六个参数shared_name：可选参数，如果设置一个‘shared_name’，则在不同的上下文环境（Session）中可以通过这个名字共享生成的tensor。
第七个参数name：可选，设置操作的名称。

tf.train.slice_input_producer定义了样本放入文件名队列的方式，包括迭代次数，是否乱序等，要真正将文件放入文件名队列，还需要调用tf.train.start_queue_runners 函数来启动执行文件名队列填充的线程，之后计算单元才可以把数据读出来，否则文件名队列为空的，计算单元就会处于一直等待状态，导致系统阻塞。

tf.train.slice_input_producer 和 tf.train.start_queue_runners 使用：

import tensorflow as tf
 
images = ['img1', 'img2', 'img3', 'img4', 'img5']
labels= [1,2,3,4,5]
 
epoch_num=8
 
f = tf.train.slice_input_producer([images, labels],num_epochs=None,shuffle=False)
#这里的images和labels也可以转化为tensor然后输入，读出的时候tf.read_file()即可，训练时使用tf.train.batch
 
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    for i in range(epoch_num):
        k = sess.run(f)
        print '************************'
        print (k)
 
    coord.request_stop()
    coord.join(threads)

tf.train.slice_input_producer函数中shuffle=False，不对tensor列表乱序，输出：

************************
['img1', 1]
************************
['img2', 2]
************************
['img3', 3]
************************
['img4', 4]
************************
['img5', 5]
************************
['img1', 1]
************************
['img2', 2]
************************
['img3', 3]

如果设置shuffle=True，输出乱序：

tf.train.string_input_producer

import tensorflow as tf

images = ['img1', 'img2', 'img3', 'img4', 'img5']

epoch_num=8
images = tf.convert_to_tensor(images)
f = tf.train.string_input_producer(images,num_epochs=None,shuffle=False)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    reader = tf.WholeFileReader()
    for i in range(epoch_num):
        _,k = reader.read(f)
        print ('************************')
        print (k)

    coord.request_stop()
    coord.join(threads)

这个函数的参数必须是stringtensor,所以输出也是tensor.

************************
Tensor("ReaderReadV2:1", shape=(), dtype=string)
************************
Tensor("ReaderReadV2_1:1", shape=(), dtype=string)
************************
Tensor("ReaderReadV2_2:1", shape=(), dtype=string)
************************
Tensor("ReaderReadV2_3:1", shape=(), dtype=string)
************************
Tensor("ReaderReadV2_4:1", shape=(), dtype=string)
************************
Tensor("ReaderReadV2_5:1", shape=(), dtype=string)
************************
Tensor("ReaderReadV2_6:1", shape=(), dtype=string)
************************
Tensor("ReaderReadV2_7:1", shape=(), dtype=string)

他们两者区别可以简单理解为：string_input_producer每次放出一个文件名。slice_input_producer可以既可以同时放出文件名和它对应的label，也可以只放出一个文件名。而在实际应用代码的时候也只是读取文件的方式不一样，其他大致相同。

string_input_producer加载图片的reader是reader = tf.WholeFileReader() key,value = reader.read(path_queue)其中key是文件名，value是byte类型的文件流二进制，一般需要解码（decode）一下才能变成数组，然后进行reshape操作。

slice_input_producer加载图片的reader使用tf.read_file(filename)直接读取。记得图片需要解码和resize成数组，才可以放入内存队列file_queue中等待调用。

tf.train.batch

tf.train.batch是一个tensor队列生成器，作用是按照给定的tensor顺序，把batch_size个tensor推送到文件队列，作为训练一个batch的数据，等待tensor出队执行计算。

batch(tensors, batch_size, num_threads=1, capacity=32,
          enqueue_many=False, shapes=None, dynamic_pad=False,  allow_smaller_final_batch=False, shared_name=None, name=None)

第一个参数tensors：tensor序列或tensor字典，可以是含有单个样本的序列;
第二个参数batch_size: 生成的batch的大小;
第三个参数num_threads：执行tensor入队操作的线程数量，可以设置使用多个线程同时并行执行，提高运行效率，但也不是数量越多越好;
第四个参数capacity：定义生成的tensor序列的最大容量;
第五个参数enqueue_many：定义第一个传入参数tensors是多个tensor组成的序列，还是单个tensor;
第六个参数shapes：可选参数，默认是推测出的传入的tensor的形状;
第七个参数dynamic_pad：定义是否允许输入的tensors具有不同的形状，设置为True，会把输入的具有不同形状的tensor归一化到相同的形状;
第八个参数allow_smaller_final_batch：设置为True，表示在tensor队列中剩下的tensor数量不够一个batch_size的情况下，允许最后一个batch的数量少于batch_size，设置为False，则不管什么情况下，生成的batch都拥有batch_size个样本;
第九个参数shared_name：可选参数，设置生成的tensor序列在不同的Session中的共享名称;
第十个参数name：操作的名称;

如果tf.train.batch的第一个参数 tensors 传入的是tenor列表或者字典，返回的是tensor列表或字典，如果传入的是只含有一个元素的列表，返回的是单个的tensor，而不是一个列表。

以下举例：一共有5个样本，设置迭代次数是2次，每个batch中含有3个样本，不打乱样本顺序：

# -*- coding:utf-8 -*-
import tensorflow as tf
import numpy as np
 
# 样本个数
sample_num=5
# 设置迭代次数
epoch_num = 2
# 设置一个批次中包含样本个数
batch_size = 3
# 计算每一轮epoch中含有的batch个数
batch_total = int(sample_num/batch_size)+1
 
# 生成4个数据和标签
def generate_data(sample_num=sample_num):
    labels = np.asarray(range(0, sample_num))
    images = np.random.random([sample_num, 224, 224, 3])
    print('image size {},label size :{}'.format(images.shape, labels.shape))
 
    return images,labels
 
def get_batch_data(batch_size=batch_size):
    images, label = generate_data()
    # 数据类型转换为tf.float32
    images = tf.cast(images, tf.float32)
    label = tf.cast(label, tf.int32)
 
    #从tensor列表中按顺序或随机抽取一个tensor
    input_queue = tf.train.slice_input_producer([images, label], shuffle=False)
 
    image_batch, label_batch = tf.train.batch(input_queue, batch_size=batch_size, num_threads=1, capacity=64)
    return image_batch, label_batch
 
image_batch, label_batch = get_batch_data(batch_size=batch_size)
 
with tf.Session() as sess:
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess, coord)
    try:
        for i in range(epoch_num):  # 每一轮迭代
            print '************'
            for j in range(batch_total): #每一个batch
                print '--------'
                # 获取每一个batch中batch_size个样本和标签
                image_batch_v, label_batch_v = sess.run([image_batch, label_batch])
                # for k in
                print(image_batch_v.shape, label_batch_v)
    except tf.errors.OutOfRangeError:
        print("done")
    finally:
        coord.request_stop()
    coord.join(threads)

输出：

************
--------
((3, 224, 224, 3), array([0, 1, 2], dtype=int32))
--------
((3, 224, 224, 3), array([3, 4, 0], dtype=int32))
************
--------
((3, 224, 224, 3), array([1, 2, 3], dtype=int32))
--------
((3, 224, 224, 3), array([4, 0, 1], dtype=int32))

每次生成的batch中含有3个样本，不打乱次序，所以生成的tensor序列是按照‘0,1,2,3,4,0,1,2,3……’排列的。

如果设置每个batch中含有2个样本，打乱次序，即设置 batch_size = 2, tf.train.slice_input_producer函数中 shuffle=True，输出为：

************
--------
((2, 224, 224, 3), array([3, 0], dtype=int32))
--------
((2, 224, 224, 3), array([4, 1], dtype=int32))
--------
((2, 224, 224, 3), array([2, 3], dtype=int32))
************
--------
((2, 224, 224, 3), array([1, 0], dtype=int32))
--------
((2, 224, 224, 3), array([2, 4], dtype=int32))
--------
((2, 224, 224, 3), array([1, 4], dtype=int32))

与tf.train.batch函数相对的还有一个tf.train.shuffle_batch函数，两个函数作用一样，都是生成一定数量的tensor,组成训练一个batch需要的数据集，区别是tf.train.shuffle_batch会打乱样本顺序。

小刘同学_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
tensorflow中 tf.train.slice_input_producer 和 tf.train.string_input_producer的区别

tensorflow数据读取机制https://blog.csdn.net/SweetSeven_/article/details/103602828之前的文章已经详细记录过了，这里介绍一下tensorflow中两个读取队列中tensor的函数的区别tf.train.slice_input_producertf.train.slice_input_producer是...
复制链接

扫一扫