InceptionV1
论文:https://arxiv.org/pdf/1409.4842.pdf
代码:参考Tensorflow/slim
特点
- 用多个尺度的卷积核组合来获得不同大小的感受野,最后拼接成不同尺度的融合,来近似局部最优的结构;
如图 3.7 所示,卷积核大小分别采用 1, 3 和 5,设定卷积步长为 1 后,只要设定填充分别为 0、 1、 2,卷积和得到相同维度的特征,就可以拼接在一起了,比如前一层输入为 100x100,那么经过 1x1 卷积核得到( 100-1) /1+1=100,100x100feature map; 经过 3*3 卷积核得到(100-3+1x2) /1+1=100,也是 100x100的 feature map ; 经 过 5x5 卷 积 核 得 到 ( 100-5+2x2 ) /1+1=100 ; 仍 然 是100x100feature map;
借鉴 NIN 中 11 卷积核来进行降维,比如前一层输入为 100x100x128,要经过 256 个 55 卷 积 层 ( 步 长 为 1 , 填 充 为 2 ); 那 么 需 要 的 参 数 为128x5x5x256=819200;而如果先经过 32 个 1x1 卷积层,再经过 256 个 5x5 卷积层 , 那 么 得 到 的 输 出 仍 然 是 100x100x256 , 但 是 需 要 的 参 数 就 变 成 了128x1x1x32+32x5x