1. 网络结构
2. 网络亮点
可以通过堆叠多个
3
∗
3
3*3
3∗3的卷积核来代替大尺度卷积核(减少所需参数)
论文中提到,可通过堆叠两个
3
∗
3
3*3
3∗3的卷积核代替
5
∗
5
5*5
5∗5的卷积核,堆叠三个
3
∗
3
3*3
3∗3的卷积核替代
7
∗
7
7*7
7∗7的卷积核
3. CNN感受野
在卷积神经网络中,决定某一层输出结果中一个元素所对应的输入层的区域大小,被称作感受野。即输出feature map上的一个单元对应输入层上区域的大小
感受野计算公式:
F
(
i
)
=
(
F
(
i
+
1
)
−
1
)
∗
S
t
r
i
d
e
+
K
s
i
z
e
F(i)=(F(i+1)-1)*Stride+Ksize
F(i)=(F(i+1)−1)∗Stride+Ksize
F(i)为第i层感受野,Stride为第i层步距,Ksize为卷积核或池化核尺寸
论文中感受野的计算:(conv的stride=1,padding=1)
论文中,可通过堆叠两个
3
∗
3
3*3
3∗3的卷积核替代
5
∗
5
5*5
5∗5的卷积核,堆叠三个
3
∗
3
3*3
3∗3的卷积核替代
7
∗
7
7*7
7∗7的卷积核
使用
7
∗
7
7*7
7∗7的卷积核所需参数,与堆叠三个
3
∗
3
3*3
3∗3卷积核所需的参数(假设输入输出channel为C)
7
∗
7
∗
C
∗
C
=
49
C
2
7*7*C*C=49C^2
7∗7∗C∗C=49C2
3
∗
3
∗
C
∗
C
+
3
∗
3
∗
C
∗
C
+
3
∗
3
∗
C
∗
C
=
27
C
2
3*3*C*C+3*3*C*C+3*3*C*C=27C^2
3∗3∗C∗C+3∗3∗C∗C+3∗3∗C∗C=27C2
o
u
t
s
i
z
e
=
(
i
n
s
i
z
e
−
F
s
i
z
e
+
2
P
)
/
S
+
1
out_{size}=(in_{size}-F_{size}+2P)/S+1
outsize=(insize−Fsize+2P)/S+1
下一篇:使用pytorch搭建VGG网络