下面用一个具体的例子体会TensorFlow中的数据读取,如下图所示,假设当前文件夹中已经有1.png,2.png,3.png三张图片,希望读取的这三张图片的5个epoch,并把读取的结果重新存到read文件夹中。
代码如下(对应的文件为test1.py)
import tensorflow as tf
#新建一个Session
with tf.Session() as sess:
#要读取的三张图片
filename = ['1.png','2.png','3.png']
#string_input_producer会产生一个文件名队列
filename_queue = tf.train.string_input_producer(filename,shuffle=False,num_epochs=5)
#reader从文件名列表中读取数据,对应方法为reader.read
reader=tf.WholeFileReader()
key,value = reader.read(filename_queue)
#tf.train.string_input_producer定义了一个epoch变量,要对他进行初始化
tf.local_variables_initializer().run()
#使用start_queue_runners之后,才会开始填充队列
threads=tf.train.start_queue_runners(sess=sess)
i=0
while True:
i += 1
#获取图片数据并保存
image_data = sess.run(value)
with open('read/test1_%d.png' % i, 'wb')as f:
f.write(image_data)
运行代码后,(程序最后会抛出一个OutOfRangeError异常,不必担心,这就是epoch跑完,队列关闭的标志),得到read文件夹中的图片,正好是按顺序的5个epoch,如下图所示
如果设置
filename_queue = tf.train.string_input_producer(filename,shuffle=False,num_epochs=5)中的shuffle=True,那么在每个epoch内图像会被打乱