不同框架表示图像时维度顺序的区别：pytorch、keras&tf、opencv、numpy、PIL

最新推荐文章于 2024-05-09 08:33:36 发布

蓝海渔夫

最新推荐文章于 2024-05-09 08:33:36 发布

阅读量692

点赞数 11

分类专栏： python pytorch 文章标签： pytorch keras opencv pillow python 人工智能 numpy

本文链接：https://blog.csdn.net/wwimhere/article/details/136572268

版权

pytorch 同时被 2 个专栏收录

16 篇文章 1 订阅

订阅专栏

python

8 篇文章 0 订阅

订阅专栏

本文详细介绍了PyTorch、Keras、OpenCV、NumPy和PIL等IT框架中图像维度的存储顺序，强调了它们各自的默认格式以及在跨库操作时的注意事项。

摘要由CSDN通过智能技术生成

在PyTorch、Keras、OpenCV、NumPy和PIL这几个框架中，它们在表示图像时的维度存储顺序有所不同。下面我将逐一解释每个框架中图像维度的存储顺序：

1，PyTorch:

PyTorch中图像的维度顺序通常遵循 [N, C, H, W] 的格式，也就是channel first格式，其中：

C 代表通道数（channels），例如RGB图像有3个通道。

N 代表批量大小（batch size），即一次处理的图像数量。

pytorch如果遇到channel last格式的输入，可以通过permute来调整维度顺序：

import torch  

# 假设x是一个形状为(N, H, W, C)的tensor  
x = torch.randn(N, H, W, C)

# 使用permute方法将channel维度移动到第二个位置  
x_channel_first = x.permute(0, 3, 1, 2)  # 形状变为(N, C, H, W)

2，Keras&tf:

Keras通常与TensorFlow一起使用。在TensorFlow中，对于图像数据，默认的维度顺序是 [H, W, C]。但在构建模型时，Keras允许通过data_format参数来指定维度顺序，可以是'channels_last'（即[H, W, C]）或'channels_first'（即[C, H, W]）。

通过如下代码可以设置：

from keras import backend as K  
  
K.set_image_data_format('channels_first')

3，OpenCV:

OpenCV读取图像时默认的维度顺序是 [H, W, C]。因此，在OpenCV中，图像的宽度和高度位于通道数之前。

4，NumPy:

NumPy本身并不直接处理图像数据，但它可以用于存储和操作多维数组。在NumPy数组中，维度的顺序完全取决于用户如何定义和填充数组。

5，PIL (Python Imaging Library, 也就是现在的Pillow):

PIL/Pillow在打开图像时，默认的维度顺序是 [W, H, C]，即宽度、高度和通道数。这与其他一些框架的顺序有所不同。

在编程过程中如果多个库混合使用，例如用OpenCV/PIL打开图像，然后输入pytorch编写的模型，需要注意这方面。

蓝海渔夫

关注

11
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
不同框架表示图像时维度顺序的区别：pytorch、keras&tf、opencv、numpy、PIL

在TensorFlow中，对于图像数据，默认的维度顺序是 [H, W, C]。但在构建模型时，Keras允许通过data_format参数来指定维度顺序，可以是'channels_last'（即[H, W, C]）或'channels_first'（即[C, H, W]）。在PyTorch、Keras、OpenCV、NumPy和PIL这几个框架中，它们在表示图像时的维度存储顺序有所不同。PIL/Pillow在打开图像时，默认的维度顺序是 [W, H, C]，即宽度、高度和通道数。
复制链接

扫一扫