其中,C是指Channel,即通道数,最常见的RGB颜色空间就有三个通道,即:
R(红)、G(绿)、B(蓝),
计算机中存储RGB格式的图片时,C有三个取值,分别为0,1,2,分别对应R,G,B
H是指高度,即纵坐标值,是指从原点(图片最左上角点)出发,水平向右为x轴,竖直向下为y轴,建立坐标系后,y轴的取值。
W是指宽度,即横坐标值,也即上述坐标系中横坐标x的取值。
故由上可知,由H和W,我们能确定图片中某一点的位置,然后C分别取0,1,2, 即分别可得到该点的红通道像素值,绿通道像素值,蓝通道像素值,然后三个像素值叠加起来共同决定这一点呈现什么颜色。
下面以这张狗的图片举例:
我们选择狗的左眼珠为例,其位置坐标(x,y)约为(481,501), 即H=501,W=481
python代码:
print(Image[0][501][481]*255) # 输出该点红通道像素值,
# 由于图像已存储为tensor类型,故像素值已经被除以255了,需要乘回来。
print(Image[1][501][481]*255) # 输出该点绿通道像素值
print(Image[2][501][481]*255) # 输出该点蓝通道像素值
输出结果为:
tensor(17.)
tensor(15.)
tensor(16.)
然后打开画图取色器,在R,G,B处分别输入对应的17,15,16
显示出来是黑色,你看狗的左眼珠子,那就是黑色吧?这就对上了。