Tensorflow基础：图像预处理

最新推荐文章于 2022-12-29 15:13:54 发布

蚊子爱牛牛

最新推荐文章于 2022-12-29 15:13:54 发布

阅读量2.1k

点赞数 3

分类专栏： tensorflow 文章标签： Tensorflow 图像预处理图像翻转色彩调整标注框

本文链接：https://blog.csdn.net/xjy104165/article/details/78255899

版权

本文详述了Tensorflow中的图像预处理技术，包括图像编码处理、大小调整、裁剪填充、翻转、色彩调整及标注框处理，旨在提高模型的准确率和健壮性。通过实际操作示例，介绍了如何利用Tensorflow对图像进行多样化处理，以适应神经网络模型的输入需求。

摘要由CSDN通过智能技术生成

通过对图像的预处理，可以尽量避免模型受到无关因素的影响。在大部分图像识别问题中，通过图像预处理过程可以提高模型的准确率。

Tensorflow提供了几类图像处理函数：

图像编码处理

RGB色彩模式的图像可以看成一个三维矩阵，矩阵中的每一个数表示了图像上的不同位置，不同颜色的亮度。然而图像在存储时并不是直接记录这些矩阵中的数字，而是记录经过压缩编码之后的结果。所以要将一张图像还原成一个三维矩阵，需要解码的过程。Tensorflow提供了对jpeg和png格式图像的编码/解码函数。以下代码示范了如何使用Tensorflow中对jpeg格式图像的编码/解码函数：

import tensorflow as tf

image_raw_data = tf.gfile.FastGFile("bird.jpg", 'r').read()

with tf.Session() as sess:
    img_data = tf.image.decode_jpeg(image_raw_data)

图像大小调整

神经网络输入节点的个数是固定的，所以在将图像的像素作为输入提供给神经网络之前，需要先将图像的大小统一。这就是图像大小调整需要完成的任务。
图像大小调整有两种方式，第一种是通过算法使得新的图像尽量保存原始图像上的所有信息。

resized = tf.image.resize_images(img_data, [300, 300], method=0)

Tensorflow提供了四种不同的方法，并且将它们封装到了tf.image.resize_image函数：method参数给出了调整图像大小的算法：

method = Bilinear interpolation（双线性插值法）
method = Nearest neighbor interpolation（最近邻法）
method = Bicubic interpolation（双三次插值法）
method = Area interpolation（面积插值法）

图像的裁剪和填充

Tensorflow提供了API对图像进行裁剪或填充

    croped = tf.image.resize_image_with_crop_or_pad(img_data, 1000, 1000)
    padded = tf.image.resize_image_with_crop_or_pad(img_data, 3000, 3000)

通过tf.image.resize_image_with_crop_or_pad函数调整图像的大小。这个函数的第一个参数为原始图像，后面两个参数是调整后的目标图像大小。如果原始图像的尺寸大于目标图像，那么这个函数会自动截取原始图像中居中的部分。如果目标图像大于原始图像，这个函数会自动在原始图像的四周填充全0背景。
Tensorflow还支持通过比例调整图像大小，以下代码给出了一个样例：

central_cropped = tf.image.central_crop(img_data, 0.5)

通过tf.image.central_crop函数可以按比例裁剪图像，这个函数的第一个参数为原始图像，第二个为调整比例，这个需要是一个(0,1]的实数。

上面介绍的图像裁剪函数都是截取或者填充图像中间的部分。Tensorflow也提供了tf.image.crop_to_bounding_box函数和tf.image.pad_to_bounding_box函数来裁剪或者填充给定区域的图像。

图像翻转

Tensorflow提供了一些函数来支持对图像的翻转。以下代码实现了将图像上下翻转、左右翻转

最低0.47元/天解锁文章

蚊子爱牛牛

关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录