本文参考Torch的dpnn包中Inception层的源码,讲解该模块参数含义以及网络结构。
核心思想
Inception模块的起点是类似下图的结构:通道从M变换到N,把多个不同尺寸的卷积结果串接(concat)起来。
由于M,N往往很大,这种结构的模型大小和运算量都不小。
卷积运算,输入M层,输出N层,核尺寸k。输入数据大小H*W。
卷积参数数量:weight + bias = M*N*k*k+N
卷积运算量:H*W*N*M^2*K^4
Inception将后续三路中插入一个1*1卷积,让每一路构成能够节省参数的“瓶颈结构”。