Tensorflow：图片文件读取

最新推荐文章于 2021-03-09 15:23:23 发布

2034丶

最新推荐文章于 2021-03-09 15:23:23 发布

阅读量222

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_45315982/article/details/103712557

版权

深度学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

图像读取

每个图片由像素组成。图片的特征值就是像素。
下面图片一个彩色一个黑白，这两张图片的像素也是不一样的，那么特征值也是不一样的。
在这里插入图片描述

黑白图片：单通道图片，一个像素点只有一个值，灰度值在[0-255]之间
彩色图片：三通道（RGB）图片，一个像素点由三个值组成

图片数字化三要素

在这里插入图片描述

三要素与张量的关系

在这里插入图片描述

图片识别的时候每一个样本必须保持相同的特征数量
图片统一特征的数量（像素值一样）

图像基本操作

目的：
1、增加图片数据的统一性
2、所有图片转换成指定大小
3、缩小图片数据量，防止增加开销

操作：
1、缩小图片大小（等比例缩小）

图像基本操作API

tf.image.resize_images(images, size)
缩小图片

images：4-D形状[batch, height, width, channels]或3-D形状的张
量[height, width, channels]的图片数据

size：1-D int32张量：new_height, new_width，图像的新尺寸
返回4-D格式或者3-D格式图片

图片批处理案例狗图片读取

图像读取API

图像读取器
tf.WholeFileReader
将文件的全部内容作为值输出的读取器
return：读取器实例
read(file_queue):输出将是一个文件名（key）和该文件的内容（值）

图像解码器
tf.image.decode_jpeg(contents)
将JPEG编码的图像解码为uint8张量
return:uint8张量，3-D形状[height, width, channels]
tf.image.decode_png(contents)
将PNG编码的图像解码为uint8或uint16张量
return:张量类型，3-D形状[height, width, channels]

import tensorflow as tf

import os
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'


def picread(filelist):
    """读取狗图片并转换成张量"""
    #1.构造文件队列
    file_queue=tf.train.string_input_producer(filelist)

    #2.构造阅读器去读取图片内容（默认读取一张图片）
    reader=tf.WholeFileReader()
    key,value=reader.read(file_queue )
    print(value)
    #3.对读取的图片数据进行解码
    image=tf.image.decode_jpeg(value)
    print(image)
    #4. 处理图片的大小（统一大小）
    image_resize=tf.image.resize_images(image,[200,200])
    print(image_resize)

    #注意：一定要把样本形状固定【200,200,3】,在批处理的时候要求所有数据形状必须定义
    image_resize.set_shape([200,200,3])

    #5.进行批处理
    image_batch=tf.train.batch([image_resize],batch_size=20,num_threads=1,capacity=20)
    print(image_batch)

    return image_batch
if __name__ == '__main__':
    #1.找到文件，放入列表
    file_name=os.listdir("./狗/")
    filelist=[os.path.join("./狗/",file) for file in file_name]
    image_batch=picread(filelist)
    #开启会话
    with tf.Session() as sess:
        #定义一个线程协调器
        coord=tf.train.Coordinator()

        #开启读取文件的线程
        threads=tf.train.start_queue_runners(sess,coord=coord)

        # 打印读取内容
        print(sess.run([image_batch]))

        # 回收子线程
        coord.request_stop()
        coord.join(threads)