图像读取
每个图片由像素组成。图片的特征值就是像素。
下面图片一个彩色一个黑白,这两张图片的像素也是不一样的,那么特征值也是不一样的。
黑白图片:单通道图片,一个像素点只有一个值,灰度值在[0-255]之间
彩色图片:三通道(RGB)图片,一个像素点由三个值组成
图片数字化三要素
三要素与张量的关系
图片识别的时候 每一个样本必须保持相同的特征数量
图片统一特征的数量(像素值一样)
图像基本操作
目的:
1、增加图片数据的统一性
2、所有图片转换成指定大小
3、缩小图片数据量,防止增加开销
操作:
1、缩小图片大小(等比例缩小)
图像基本操作API
tf.image.resize_images(images, size)
缩小图片
images:4-D形状[batch, height, width, channels]或3-D形状的张
量[height, width, channels]的图片数据
size:1-D int32张量:new_height, new_width,图像的新尺寸
返回4-D格式或者3-D格式图片
图片批处理案例 狗图片读取
图像读取API
图像读取器
tf.WholeFileReader
将文件的全部内容作为值输出的读取器
return:读取器实例
read(file_queue):输出将是一个文件名(key)和该文件的内容(值)
图像解码器
tf.image.decode_jpeg(contents)
将JPEG编码的图像解码为uint8张量
return:uint8张量,3-D形状[height, width, channels]
tf.image.decode_png(contents)
将PNG编码的图像解码为uint8或uint16张量
return:张量类型,3-D形状[height, width, channels]
import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'
def picread(filelist):
"""读取狗图片并转换成张量"""
#1.构造文件队列
file_queue=tf.train.string_input_producer(filelist)
#2.构造阅读器去读取图片内容(默认读取一张图片)
reader=tf.WholeFileReader()
key,value=reader.read(file_queue )
print(value)
#3.对读取的图片数据进行解码
image=tf.image.decode_jpeg(value)
print(image)
#4. 处理图片的大小(统一大小)
image_resize=tf.image.resize_images(image,[200,200])
print(image_resize)
#注意:一定要把样本形状固定【200,200,3】,在批处理的时候要求所有数据形状必须定义
image_resize.set_shape([200,200,3])
#5.进行批处理
image_batch=tf.train.batch([image_resize],batch_size=20,num_threads=1,capacity=20)
print(image_batch)
return image_batch
if __name__ == '__main__':
#1.找到文件,放入列表
file_name=os.listdir("./狗/")
filelist=[os.path.join("./狗/",file) for file in file_name]
image_batch=picread(filelist)
#开启会话
with tf.Session() as sess:
#定义一个线程协调器
coord=tf.train.Coordinator()
#开启读取文件的线程
threads=tf.train.start_queue_runners(sess,coord=coord)
# 打印读取内容
print(sess.run([image_batch]))
# 回收子线程
coord.request_stop()
coord.join(threads)