Motivation
看代码的时候看到有用np.stack()对图像数据做打包的操作,其中的参数axis = 2
没太搞明白是什么意思,查了查教程自己做做实验发现网上的教程写的都太麻烦了…理解起来并不直观。于是有了这篇博文
代码分析
from matplotlib import pyplot as plt
import numpy as np
# 这里大家不用管我代码的细节,只需要知道LLY,LHY,HLY,HHY都是32x32的图片就好了
LLY,(LHY,HLY,HHY) = pywt.dwt2(img, 'haar')
plt.subplot(2, 4, 1)
plt.imshow(LLY, cmap="Greys")
plt.subplot(2, 4, 2)
plt.imshow(LHY, cmap="Greys")
plt.subplot(2, 4, 3)
plt.imshow(HLY, cmap="Greys")
plt.subplot(2, 4, 4)
plt.imshow(HHY, cmap="Greys")
Y = np.stack((LLY, LHY, HLY, HHY), axis=2)
print(Y.shape)
plt.subplot(2, 4, 5)
plt.imshow(Y[:, :, 0], cmap="Greys")
plt.subplot(2, 4, 6)
plt.imshow(Y[:, :, 1], cmap="Greys")
plt.subplot(2, 4, 7)
plt.imshow(Y[:, :, 2], cmap="Greys")
plt.subplot(2, 4, 8)
plt.imshow(Y[:, :, 3], cmap="Greys")
plt.show()
Y = np.stack((LLY, LHY, HLY, HHY), axis=0)
print(Y.shape)
我们来看一下结果:
(32, 32, 4)
(4, 32, 32)
如果我们把Y = np.stack((LLY, LHY, HLY, HHY), axis=2)
改为Y = np.stack((LLY, LHY, HLY, HHY), axis=1)
,然后按照轴1来打印,我们依旧可以得到这个结果:
而Y的shape变为:
(32, 4, 32)
理解
经过上面的实验给出一个简单的理解。不用看网上那堆什么按照这个轴那个轴堆叠起来。
以图像数据为例,axis= n
其实意思就是以第n个维度为堆叠轴。比如axis = 0
其实就是我们最常见的stack方式,假设有10张32x32的图片,由axis = 0
堆叠而成,我们称这个stack为Y的话,Y[0]、Y[1]......Y[9]
表示的就是单个图像。同理,如果我们选择axis = 1
堆叠,那么你的输出纬度的第二个维度就表示的是堆叠轴(图像是二维,增加了一个堆叠轴,变成三维),选择第二个维度,就可以输出单个图像,即Y[:, 0, :]、Y[:, 1, :]......Y[:, 9, :]
。
更高维度也同理,我们可以不用管他中间到底是把哪一行抽出来变成了哪一行,只需要从更宏观一点的角度理解这个函数到底做了什么操作就可以。