一、Inception v4整体架构
Inception v4的整体框架如图9所示:
分为6大模块:Stem;Inception-A、B、C;Reduction-A、B。每个模块针对性的设计。这也是缺点吧,适用性很差。换一个数据集谁知道行不行,谁知道改哪里啊。所以现在很少能看到inception v4和inception resnet,几乎没人用。
二、详细介绍
2.1 Stem
Stem(主干),最大的作用就是快速降低特征图的分辨率,使得后面的inception减小计算量。共有9层。也可以分为4部分去看,代码就是这么组织的。
图中带了"V"表示不进行padding。不带"V"是进行padding,使得图像尺寸不变。图中有点小错误,最后一个的做分支,stride应该为2。最后一个maxpool, kernel = 3*3。
输入图片是299*299*3
第一部分:3个3*3卷积
(1) 3*3*32 conv, stride=2, padding=0。(299-3)/2+ 1 = 149。输出149*149*32
(2)3*3*32 conv,stride=1,padding=0。(149+0-3)/1 + 1 = 147。输出147*147*32
(3) 3*3*64 conv, stride=1, padding=1。(147+2-3)/1 + 1 = 147。输出147*147*64
第二部分:【对应代码:Mixed_3a】
(1) branch 1:3*3 pool, stride=2, padding=0。(147&