学过CNN的都知道im2col是非常重要的函数之一,用于将输入的四维数据转化成二维数据方便进行卷积运算。
代码虽就10来行不过要理解透彻还是相当不容易的,第一次写涉及到如此高维的数据处理,有点难以适应...
im2col
def im2col(input_data, filter_h, filter_w, stride=1, pad=0):
"""
Parameters
----------
input_data : 由(数据量, 通道, 高, 长)的4维数组构成的输入数据
filter_h : 滤波器的高
filter_w : 滤波器的长
stride : 步幅
pad : 填充
Returns
-------
col : 2维数组
"""
N, C, H, W = input_data.shape
out_h = (H + 2*pad - filter_h)//stride + 1
out_w = (W + 2*pad - filter_w)//stride + 1
img = np.pad(input_data, [(0,0), (0,0), (pad, pad), (pad, pad)], 'constant')
col = np.zeros((N, C, filter_h, filter_w, out_h, out_w))
for y in range(filter_h):
# 这一步是因为y还可以往下走(out_h - 1)步,所以需要计算ymax,用y:y_max:stride的方式来表达每一次的跨步
y_max = y + stride*out_h
for x in r