说明
自己的学习总结,参考了其他一些博客并加上了自己的一些理解,所以有部分直接复制的内容变量表示会不同(侵删),如有谬误,欢迎指正
基础知识
变量表示
输入图片的宽和高:i_w 和 i_h
输出特征图的宽和高:o_w 和 o_h
过滤器的宽和高:f_w 和 f_h
宽和高方向的步长:s_w 和 s_h
宽和高方向总的补零个数:pad_w 和 pad_h
顶部和底部的补零个数:pad_top 和 pad_bottom
左部和右部的补零个数:pad_left 和 pad_right
padding参数的作用是决定在进行卷积或池化操作时,是否对输入的图像矩阵边缘补0。
计算公式
正卷积
在正卷积时,一般我们希望卷积输入形状为输出形状的几倍,例如输入 256_256,输出 128_128,所以 o_w = i_w / s_w
,又有 o_w = (i_w - f_w + pad_w) / s_w + 1
, 所以可以得出 pad_w = f_w - s_w
,pad_h
类推。
反卷积
同理,在反卷积时,我们希望卷积输出形状为输入形状的几倍,例如输入 8_8,输出 256_256,所以 o_w = i_w * s_w
,又有 o_w = i_w * s_w + f_w - s_w - pad_w
, 所以可以得出 pad_w = f_w - s_w
不变,pad_h
类推。
SAME和VALID解释
VALID:边缘不填充
VALID方式就是这个单词的意思,也就是不进行填充,对于多出来的数据,直接丢掉
向上取整是为了1/strides_width一定是取1,这里的“1”是因为filter即使一步不动,原本也会有一步的输出
输入宽和高的公式分别为:
output_width=(in_width-filter_width+1)/strides_width #(结果向上取整)
output_height=(in_height-filter_height+1)/strides_height #(结果向上取整)
等价于:
output_width=(<