一、Inception Module
- 本文提出了一种名为Inception的深度卷积神经网络,获得了ILSVRC的检测与分类冠军
- Inception提高计算资源率,增加了网络的深度与宽度,参数少量增加。
- 借鉴Hebbian principle(赫布理论)和 多尺度处理。
左图是简单版本,右图是改进版本。相对于左图,Inception结构1×1 卷积用于降维,作为信息融合的一种方式。
Inception结构,采用了多尺度卷积(1×1 3×3 5×5)提取不同的特征。1×1 卷积用于降维,作为信息融合的一种方式。3×3 max pooling 保留了特征图数量。
下图是Inception结构简单版本,未引入1×1 卷积。
Naive版本问题:数据量大、计算量大。
1×1 卷积原理及作用:压缩特征厚度,信息融合
下图是改进的inception结构:
- 在卷积之前,使用1×1卷积先压缩通道,使整个网络的计算量大大降低。
- 在max pooling后,原来通道太大,采用1×1卷积减少通道。
如果直接采用3×3的卷积 作用与28×28的图像,则需要参数量为3×3×256×192。加入1×1卷积后,参数量为 1×1×256×64 + 3×3×64×192,参数量明显降低。
二、GoogLeNet 结构
蓝色—卷积
红色—池化
绿色—LRN/特征融合
黄色—激活函数
GoogLeNet可分为3个阶段:
- conv-pool-conv-pool 快速降低分辨率。
- 堆叠Inception,达22层。
- FC层分类输出。
GoogLeNet 还增加了两个辅助损失,缓解了梯度损失。(中间层分类输出层使用)
GoogLeNet参数表:
三、GoogLeNet(Pytorch实现)