[转载]卷积,池化操作后的图像尺寸计算
一,卷积操作
若图像为正方形:设输入图像尺寸为WxW,卷积核尺寸为FxF,步幅为S,Padding使用P,经过该卷积层后输出的图像尺寸为NxN:
N
=
W
−
F
+
2
P
S
+
1
N=\frac {W-F+2P} {S} +1
N=SW−F+2P+1
若图像为矩形:设输入图像尺寸为WxH,卷积核的尺寸为FxF,步幅为S,图像深度(通道数)为C,Padding使用P,则:
卷积后输出图像大小:
W
=
W
−
F
+
2
P
S
+
1
H
=
H
−
F
+
2
P
S
+
1
W=\frac {W-F+2P}{S}+1 \\ H=\frac {H-F+2P}{S}+1
W=SW−F+2P+1H=SH−F+2P+1
输出图像的通道数=C
注意:Padding的作用用于解决图像边缘信息损失的问题,用于补充
如same:(same模式只有步长为1时,输入和输出的尺度才相同)
输入特征图为5x5,卷积核为3x3,外加padding 为1,则其输出尺寸为
5
−
3
+
2
∗
1
1
+
1
=
5
\frac {5-3+2*1} {1} +1=5
15−3+2∗1+1=5
二,池化操作
设输入图像尺寸为WxH,其中W:图像宽,H:图像高,D:图像深度(通道数),卷积核的尺寸为FxF,S:步长
池化后输出图像大小:
W
=
W
−
F
S
+
1
H
=
H
−
F
S
+
1
W=\frac {W-F} {S} +1\\ H=\frac {H-F} {S} +1\\
W=SW−F+1H=SH−F+1
池化后输出图像深度为D
当进行池化操作时,步长S就等于池化核的尺寸,如输入为24x24,池化核为4x4,则输出为
W
=
24
−
4
4
+
1
=
6
W=\frac {24-4} {4}+1=6
W=424−4+1=6
若除不尽,则取较小的数,如池化核为7x7,则输出为
W
=
[
24
−
7
7
]
=
3
W=[\frac {24-7} {7}] =3
W=[724−7]=3
,不是用四舍五入,就是取最小的整数,即使为3.9,也是 取3
三,空洞卷积(也称扩张卷积,膨胀卷积)–dilated convolution
W = W − d ( k − 1 ) − 2 p s + 1 W=\frac {W-d(k-1)-2p} {s} +1 W=sW−d(k−1)−2p+1
其中 d为空洞卷积的空洞率(正常的卷积d=1),p为padding,k为kernel size
举个例子:
下面的空洞卷积核是d=2,k=2的空洞卷积卷积核。
当d=2,k=2时,-d(k-1)-1 = -3,即相当于 一个k=3的正常卷积核。