如何理解图片RGB通道在python（numpy）中的数据构成

最新推荐文章于 2022-07-11 14:33:54 发布

老三是只猫

最新推荐文章于 2022-07-11 14:33:54 发布

阅读量1.6k

点赞数 2

分类专栏： python 图像处理

python 同时被 2 个专栏收录

142 篇文章 7 订阅

订阅专栏

图像处理

23 篇文章 1 订阅

订阅专栏

该文将尽可能简短的描述基于numpy，在python中使用skimage的io或PIL或其他方法读取图片后GRB数据的结构与呈现方式。

我们肉眼看到的图片无非两种（灰色和彩色），而通过编程语言转换为电脑能认识的模样也就是数字了。这些数字决定了在电脑中它是彩色还是灰色，对于彩色图片决定的方式就是——颜色通道，而最常见的就是RGB三通道了，顾名思义RGB三色通道就是指由R、G、B三个通道组成的。

这里需要说明的一点就是RGB三色道分别对应三个矩阵，而这三个矩阵都是数字向量构成的矩阵，并不代表颜色的意思（矩阵能代表颜色吗？），这里比较贴切可以理解为调色板，例如当该矩阵的某个位置的数值较大，则表示该处对应调色板使用的颜色就越”白/浅“，而越小则对应调色板使用颜色越“黑/深”。8bit的图像，对应的矩阵元素取值为0-255（也可以使用0-1表示），这里我们主要理解数据，对于图像的理解下面给出链接。

看一张图片：

这是一张彩色图片，现在通过skimage的io方法读取该图片后在numpy中呈现的数据格式如下：

通过shape得到图形形状（287,496,3），其中287表示列，496表示行，3表示分量（即三个通道分量），是不是有点蒙，下面正是本文要讲的重点，如何理解上面读取出来的数据格式？

首先我们应该按列来看，可以看到有3列（即190 48 64对应往下的3列），这便是RGB对应的 3 个通道，从头到尾的一列数据构成了一个通道分量，共三个：

然后再来理解287，从上图中可以看到有很多的 [ 符号，其实按层次来分也就三层，这里的287表示共有287个中间层的矩阵：

最后再来看496，这个数字从哪来？上面的287个矩阵中每一个矩阵的每一列都有496个元素（数字），虽然这些数字是按照行来分块，但实际上列之间的元素才有关联，每一列的元素组合成行，构成了该通道矩阵的一行数据：

下面来看看将上面的整体矩阵分解为三个通道后的模样，做个对比是不是清楚很多了。

上面的三个通道为相同的矩阵大小，而后将三者按照通道顺序排列重叠后构成了RGB彩色图片，当然顺序有可能不是RBG，例如opencv转换后为BGR。

以上为彩色图片在numpy中解析后的理解介绍，下面是部分代码：


 
 
   
   
    
    
   
   
   
   
    
    
     
     from skimage 
     
     import io
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     path_c = 
     
     r"G:\c.png"
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     color = io.imread(path_c)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     print(color,color.shape)
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     # R
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     print(color[:,:,
     
     0],color[:,:,
     
     0].shape)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     # G
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     print(color[:,:,
     
     1],color[:,:,
     
     1].shape)
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     # B
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     print(color[:,:,
     
     2],color[:,:,
     
     2].shape)
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     fig,axes = plt.subplots(
     
     1,
     
     3,figsize=(
     
     12,
     
     7))
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     axes[
     
     0].imshow(color[:,:,
     
     0])
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     axes[
     
     0].set_title(
     
     'R')
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     axes[
     
     1].imshow(color[:,:,
     
     1])
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     axes[
     
     1].set_title(
     
     'G')
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     axes[
     
     2].imshow(color[:,:,
     
     2])
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     axes[
     
     2].set_title(
     
     'B')
    
    
   
   

   
   
    
    
   
   
   
   
    
     
    
    
   
   

   
   
    
    
   
   
   
   
    
    
     
     plt.show()

该文仅为理解图片的数据构成，跟多详细的内容还请自行Google。

图片通道理解可以看看：https://blog.csdn.net/silence2015/article/details/53789748/

老三是只猫

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
如何理解图片RGB通道在python（numpy）中的数据构成

该文将尽可能简短的描述基于numpy，在python中使用skimage的io或PIL或其他方法读取图片后GRB数据的结构与呈现方式。我们肉眼看到的图片无非两种（灰色和彩色），而通过编程语言转换为电脑能认识的模样也就是数字了。这些数字决定了在电脑中它是彩色还是灰色，对于彩色图片决定的方式就是——颜色通道，而最常见的就是RGB三通道了，顾名思义RGB三色通道就是指由R、G、B三个通道组成的。这里...
复制链接

扫一扫