图片读取
介绍
黑白照片属于单通道,彩色照片属于三通道(每个像素点由RGB三个值组成)
单通道图片的一个像素点只有一个值,叫“灰度值“,范围在[0,255]
三通道图片的一个像素点由三个值组成
单通道图片的像素值(特征)的个数:长*宽
三通道图片的像素值(特征)的个数:长*宽*3
图片数字化三要素:长度、宽度、通道数
三要素与张量的关系
指定3-D张量:[height, width, channels] (长度、宽度、通道数)
图像基本操作
目的:
1、增加图片数据的统一性
2、所有图片转换成指定大小(像素值要一样,就是特征个数一样)
3、缩小图片数据量,防止增加开销
操作:
1、缩小图片大小
tf.image.resize_images(images,size)
- images:4-D形状[batch, height, width, channels]或3-D形状的张量[height, width, channels]的图片数据(batch表示批量处理图片的数量)
- size:1-D int32张量,new_height,new_width, 图像的新尺寸
- return:4-D格式或3-D格式图片
图片批处理案例
流程还是一样的,就是文件读取和解码的API不同:
步骤1、构造图片文件队列
步骤2、构造图片阅读器
步骤3、读取图片数据
步骤4、处理图片数据
图片数据展示:
完整代码如下:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' # 设置告警级别
def picread(filelist):
"""
读取狗图片并转换成张量
:param filelist: 文件路径 + 名字的列表
:return: 每张图片的张量
"""
# 1、构造文件队列
file_queue = tf.train.string_input_producer(filelist)
# 2、构造阅读器取读取图片内容(默认读取一张图片)
reader = tf.WholeFileReader()
key, value = reader.read(file_queue)
# 3、对读取的图片解码
image = tf.image.decode_jpeg(value)
print(image) # Tensor("DecodeJpeg:0", shape=(?, ?, ?), dtype=uint8)
# 4、处理图片的大小(统一大小)
image_resize = tf.image.resize_images(image, [200, 200])
print(image_resize) # Tensor("resize_images/Squeeze:0", shape=(200, 200, ?), dtype=float32)
# 5、一定要把样本的形状固定 [200, 200, 3] 批处理要求图片形状固定
image_resize.set_shape([200, 200, 3])
# 6、进行批处理 (通道数不确定,批处理会报错)
image_batch = tf.train.batch([image_resize], batch_size=10, num_threads=1, capacity=10)
print(image_batch)
return image_batch
if __name__ == '__main__':
# 读取图片文件案例
# 找到文件,放入列表
file_name = os.listdir("./dog/")
filelist = [os.path.join("./dog/", file) for file in file_name]
image_batch = picread(filelist)
# 开启会话运行结果
with tf.Session() as sess:
# 定义一个线程协调器
coord = tf.train.Coordinator()
# 开启读文件的线程
threads = tf.train.start_queue_runners(sess, coord=coord)
# 打印读取的内容
print(sess.run([image_batch]))
# 回收子线程
coord.request_stop()
coord.join(threads)
运行后如下: