文章标题

yiqingyang2012

于 2017-03-29 16:02:20 发布

阅读量433

点赞数

分类专栏： tensorflow 文章标签： tensorflow

tensorflow 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

转自：http://blog.csdn.net/lujiandong1/article/details/53369961

队列本身也是图中的一个节点。其他节点（enqueue, dequeue）可以修改队列节点中的内容。

#-*- coding:utf-8 -*-  
import tensorflow as tf  

#创建的图:一个先入先出队列,以及初始化,出队,+1,入队操作  
q = tf.FIFOQueue(3, "float")  
init = q.enqueue_many(([0.1, 0.2, 0.3],))  
x = q.dequeue()  
y = x + 1  
q_inc = q.enqueue([y])  

#开启一个session,session是会话,会话的潜在含义是状态保持,各种tensor的状态保持  
with tf.Session() as sess:  
        sess.run(init)  

        for i in range(2):  
                sess.run(q_inc)  

        quelen =  sess.run(q.size())  
        for i in range(quelen):  
                print (sess.run(q.dequeue()))

queueRunner

上面那个例子里，入队操作在主线程中进行, 其实Session中可以多个线程一起运行。在实际应用中，入队操作从硬盘读取数据放入内存中，速度较慢。使用QueueRunner可以创建多个新的线程进行入队操作，让主线程继续使用数据。如在训练神经网络的场景中，主线程在训练网络，另一个线程在将数据从硬盘读入内存。

例子1：

#-*- coding:utf-8 -*-  
import tensorflow as tf  
import sys  
#创建稍微复杂一点的队列作为例子  
q = tf.FIFOQueue(1000,"float")  
#计数器，初始化为0.0  
counter = tf.Variable(0.0)  
#操作:给计数器加一  
increment_op = tf.assign_add(counter,tf.constant(1.0))  
#操作:将计数器加入队列  
enqueue_op = q.enqueue(counter)  

#创建一个队列管理器QueueRunner，用这两个操作向q中添加元素。目前我们只使用一个线程:  
qr = tf.train.QueueRunner(q,enqueue_ops=[increment_op,enqueue_op]*1)  


#从队列管理器中创建线程，并启动:  
#主线程  
with tf.Session() as sess:  
        sess.run(tf.initialize_all_variables())  
        enqueue_threads = qr.create_threads(sess, start=True)  # 启动入队线程  
        #主线程  
        for i in range(10):  
                print "----------------------:"  
                print (sess.run(q.dequeue()))

创建线程create_threads后，每个线程都会通过QueueRunner使用 [increment_op,enqueue_op]往队列中输入元素。

运行结果：能正确输出结果，但是最后会报错，ERROR:tensorflow:Exception in QueueRunner: Attempted to use a closed Session.ERROR:tensorflow:Exception in QueueRunner: Session has been closed.也就是说,当循环结束后,该Session就会自动关闭，相当于main函数已经结束了

例子2：

#-*- coding:utf-8 -*-  
import tensorflow as tf  
import sys  
#创建稍微复杂一点的队列作为例子  
q = tf.FIFOQueue(1000,"float")  
#计数器  
counter = tf.Variable(0.0)  
#操作:给计数器加一  
increment_op = tf.assign_add(counter,tf.constant(1.0))  
#操作:将计数器加入队列  
enqueue_op = q.enqueue(counter)  

#创建一个队列管理器QueueRunner，用这两个操作向q中添加元素。目前我们只使用一个线程:  
qr = tf.train.QueueRunner(q,enqueue_ops=[increment_op,enqueue_op]*1)  

# 主线程  
sess = tf.Session()  
sess.run(tf.initialize_all_variables())  

enqueue_threads = qr.create_threads(sess, start=True)  # 启动入队线程  

# 主线程  
for i in range(0, 10):  
    print(sess.run(q.dequeue()))

运行结果：例子2中不使用with tf.Session,那么Session就不会自动关闭，输出的结果是
3.0
6.0
9.0
13.0
并不是：1,2,3,4。本质原因是+1操作和入队操作不同步，可能+1操作执行了很多次之后，才会进行一次入队操作。并且出队结束后，程序本应结束，但是因为入队线程没有显示结束，所以，整个程序就跟挂起一样，也结束不了。

经验：因为tensorflow是在图上进行计算，要驱动一张图进行计算，必须要送入数据，如果说数据没有送进去，那么sess.run()就无法执行，tf也不会主动报错提示没有数据送进去，其实tf也不能主动报错，因为tf的训练过程和读取数据的过程是异步的。tf会一直挂起，等待数据准备好。现象就是tf的程序不报错，但是一直不动，跟挂起类似。

比如下例：

#-*- coding:utf-8 -*-  
import tensorflow as tf  
import sys  
#创建稍微复杂一点的队列作为例子  
q = tf.FIFOQueue(1000,"float")  
#计数器  
counter = tf.Variable(0.0)  
#操作:给计数器加一  
increment_op = tf.assign_add(counter,tf.constant(1.0))  
#操作:将计数器加入队列  
enqueue_op = q.enqueue(counter)  

#创建一个队列管理器QueueRunner，用这两个操作向q中添加元素。目前我们只使用一个线程:  
qr = tf.train.QueueRunner(q,enqueue_ops=[increment_op,enqueue_op]*1)  

# 主线程  
sess = tf.Session()  
sess.run(tf.initialize_all_variables())  

#enqueue_threads = qr.create_threads(sess, start=True)  # 启动入队线程  

# 主线程  
for i in range(0, 10):  
    print "-------------------------"  
    print(sess.run(q.dequeue()))

上图将生成数据的线程注释掉，程序就会卡在sess.run(q.dequeue())，等待数据的到来。queueRunner是用来启动入队线程用的。

启动所有线程

在读入数据例子中，使用tf.train.string_input_produecer和tf.train.shuffle_batch会把两个QueueRunner添加到全局图中。

由于没有显式地返回QueueRunner来用create_threads创建并启动线程，必须这样做：

tf.train.start_queue_runners(sess=sess)

启动tf.GraphKeys.QUEUE_RUNNERS集合中的所有队列线程。

Coordinator

#-*- coding:utf-8 -*-  
import tensorflow as tf  
import sys  
#创建稍微复杂一点的队列作为例子  
q = tf.FIFOQueue(1000,"float")  
#计数器  
counter = tf.Variable(0.0)  
#操作:给计数器加一  
increment_op = tf.assign_add(counter,tf.constant(1.0))  
enqueue_op = q.enqueue(counter) # 操作：计数器值加入队列  
#操作:将计数器加入队列  
qr = tf.train.QueueRunner(q, enqueue_ops=[increment_op, enqueue_op] * 1)  

# 主线程  
sess = tf.Session()  
sess.run(tf.initialize_all_variables())  

#Coordinator:协调器,协调线程间的关系,可以视为一种信号量,用来做同步  
coord = tf.train.Coordinator()  

## 启动入队线程, Coordinator是线程的参数  
enqueue_threads = qr.create_threads(sess, coord = coord,start=True)  # 启动入队线程  

# 主线程  
for i in range(0, 10):  
    print "-------------------------"  
    print(sess.run(q.dequeue()))  

#通知其他线程关闭  
coord.request_stop()  
#其他所有线程关闭之后，这一函数才能返回  
#join操作经常用在线程当中,其作用是等待某线程结束  
coord.join(enqueue_threads)

说明：QueueRunner的例子有一个问题：由于入队线程自顾自地执行，在出队操作完成之后，程序没法结束。使用tf.train.Coordinator来终止其他线程。其实可以认为是做一些线程间的同步关系。

yiqingyang2012

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文章标题

转自：http://blog.csdn.net/lujiandong1/article/details/53369961队列本身也是图中的一个节点。其他节点（enqueue, dequeue）可以修改队列节点中的内容。#-*- coding:utf-8 -*- import tensorflow as tf #创建的图:一个先入先出队列,以及初始化,出队,+1,入队操作 q = tf.FI
复制链接

扫一扫

专栏目录