目录
Xception
Xception是完全基于深度分离卷积的网络。深度分离卷积可参考这篇文章
上图:Xception有36层网络,因为主要将网络运用于图像分类,所以在卷积层后面添加一层逻辑回归层。卷积层和逻辑回归层之间的全连接层可按需求添加。将36层网络划分为14个模块,除了第一个和最后一个模块之外,其余模块均用线型残差模块进行连接。
作者将Xception运用在ImageNet数据集和JFT数据集,训练参数的比较如下:
作者将Xception和InceptionV3进行了对比,相关参数设置如下:
上图:权重衰减(又称L2正则化):Inception的权重衰减设置为4e-5,是基于ImageNet数据集进行仔细调整决定的参数值。Xception的权重衰减设置为1e-5,其性能比Inception要好。在JFT数据集实验中设置了相同的参数值。
上图:对于ImageNet数据集,两个模型的dropout=0.5,均搭建在logistic回归层前面。对于JFT数据集,没有dropout层,因为数据集很大,在任何时候都没有理由会过拟合。
在InceptionV3中的辅助损失结构可有可无,其作为附加的正则化机制,可以较早地反向传播分类损失。但是在Xception中没有该结构。
Xception框架图如下:图注:输入数据首先经entry flow,然后经过middle flow,在这一部分进行8次迭代,最后流经Exit flow。注意,所有卷积层和可分离卷积层后面都有BN层(图中没有标注BN层)。所有分离卷积层用一个尺寸为1的depth multiplier,(没有深度扩展)。