【Tensorflow】数据读取——文件读取(图片)

why do not

于 2020-11-11 16:02:04 发布

阅读量727

点赞数

本文链接：https://blog.csdn.net/qq_42994177/article/details/109614948

版权

深度学习专栏收录该内容

16 篇文章 6 订阅

订阅专栏

图片读取

介绍

黑白照片属于单通道，彩色照片属于三通道（每个像素点由RGB三个值组成）

单通道图片的一个像素点只有一个值，叫“灰度值“，范围在[0，255]

三通道图片的一个像素点由三个值组成

单通道图片的像素值（特征）的个数：长*宽

三通道图片的像素值（特征）的个数：长*宽*3

图片数字化三要素：长度、宽度、通道数

三要素与张量的关系

指定3-D张量：[height, width, channels] （长度、宽度、通道数）

图像基本操作

目的：

1、增加图片数据的统一性

2、所有图片转换成指定大小（像素值要一样，就是特征个数一样）

3、缩小图片数据量，防止增加开销

操作：

1、缩小图片大小

tf.image.resize_images(images,size)

images：4-D形状[batch, height, width, channels]或3-D形状的张量[height, width, channels]的图片数据（batch表示批量处理图片的数量）
size：1-D int32张量，new_height,new_width, 图像的新尺寸
return：4-D格式或3-D格式图片

图片批处理案例

流程还是一样的，就是文件读取和解码的API不同：

步骤1、构造图片文件队列

步骤2、构造图片阅读器

步骤3、读取图片数据

步骤4、处理图片数据

图片数据展示：

完整代码如下：

#! /usr/bin/env python 
# -*- coding:utf-8 -*-
import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'   # 设置告警级别


def picread(filelist):
    """
    读取狗图片并转换成张量
    :param filelist: 文件路径 + 名字的列表
    :return: 每张图片的张量
    """
    # 1、构造文件队列
    file_queue = tf.train.string_input_producer(filelist)

    # 2、构造阅读器取读取图片内容（默认读取一张图片）
    reader = tf.WholeFileReader()
    key, value = reader.read(file_queue)

    # 3、对读取的图片解码
    image = tf.image.decode_jpeg(value)
    print(image)  # Tensor("DecodeJpeg:0", shape=(?, ?, ?), dtype=uint8)

    # 4、处理图片的大小（统一大小）
    image_resize = tf.image.resize_images(image, [200, 200])
    print(image_resize)  # Tensor("resize_images/Squeeze:0", shape=(200, 200, ?), dtype=float32)

    # 5、一定要把样本的形状固定  [200, 200, 3]  批处理要求图片形状固定
    image_resize.set_shape([200, 200, 3])

    # 6、进行批处理 (通道数不确定，批处理会报错)
    image_batch = tf.train.batch([image_resize], batch_size=10, num_threads=1, capacity=10)
    print(image_batch)

    return image_batch



if __name__ == '__main__':


    # 读取图片文件案例
    # 找到文件，放入列表
    file_name = os.listdir("./dog/")
    filelist = [os.path.join("./dog/", file) for file in file_name]

    image_batch = picread(filelist)

    # 开启会话运行结果
    with tf.Session() as sess:
        # 定义一个线程协调器
        coord = tf.train.Coordinator()

        # 开启读文件的线程
        threads = tf.train.start_queue_runners(sess, coord=coord)

        # 打印读取的内容
        print(sess.run([image_batch]))

        # 回收子线程
        coord.request_stop()
        coord.join(threads)

运行后如下：