2015年12月,Rethinking the Inception Architecture for Computer Vision一文中提出了Inceoption V3模型。
推荐博客:
《Rethinking the Inception Architecture for Computer Vision》笔记
相比于Inception V2中,将5x5用两个3X3代替,在Inception V3网络主要有两个方面的改造:
(1)将大卷积空间上分解为非对称卷积。比如将7x7卷积拆分成1x7和7x1的卷积。或者将3x3的卷积分解为1x3和3x1的卷积。这样做法一方面节约了大量参数,加速了运算并减轻了过拟合,同时增加了非线性层扩展了模型的表达能力。
论文指出: 这种非对称的的卷积拆分结构,其结果比对称的分解小卷积效果更明显,可以处理更多、更丰富的空间特征,增加特征多样性。
(2)Inception V3中还优化Inception module(V1、V2)的结构。目前共有3种(35*35, 17*17, 8*8)
这些module只在网络后面出现,前部还是普通的卷积层。