Inception网络名字来源于《盗梦空间》。inception网络代替人工确定卷积层中的过滤器类型,解决了计算量爆炸的问题,让网络变得更深。
Inception模块:
Inception网络由多个Inception模块连接而成。Inception模块使用多个过滤器类型以及最大化池堆叠而成,让机器自己学习使用哪些过滤器类型。结构如图所示:
其中使用padding可以保证输出的维度相同。
以5*5的卷积核为例,我们可以计算出它的计算量为1.2亿。这样巨大的计算量显然是无法接受的。
我们可以增加一个1*1的卷积层,将输入数据的192个通道压缩为较少的通道数,实践证明这样做并不会损失性能。这样做可以将计算量减少到1240万。
你可能会困惑怎么将池化层压缩。我们可以在池化层后面增加一个1*1的卷积层,这样就可以将池化层压缩为较少的通道数。
Inception网络:
Inception网络就是将多个Inception模块连接成一个网络。
网络的最后几层通常为全连接层,最后接一个softmax层。可以看到网络中的隐藏层有很多分支。这些分支使得隐藏层也可以单独进行预测,降低了过拟合的风险。
更新的版本中引入了跳跃连接的方法。