Xception在论文Xception: Deep Learning with Depthwise Separable Convolutions中被提出.Xception是对Inception V3的一种改进.主要将Inception V3中的Inception结构替换为depthwise separable convolution如图:
最左侧为Inception V3中使用的Inception结构.如图:
中间为考虑仅使用一种卷积大小(3x3)并且不包含池化层的Inception模块的简化版本.如图:
这个Inception模块可以用一个统一的1x1卷积,然后是3x3的空间卷积,这些卷积可以在输出通道的非重叠段上运行,即只将1x1卷积结果的一部分作为自己的输入.
热后增加输出通道上分段的数量.每个3*3的卷积即作用于仅包含一个通道的特征图上.作者称之为“extreme”Inception.即Xception的基本模块,如图:
使用该模块,搭建Xception网络,如图:
然后作者分别在ImageNet和JFT上训练测试并与Inception V3做对比,发现Xception的准确度提高的同时,收敛过程也比前者快:
同时Xception的参数数量也有所下降: