摘要:
这篇论文主要讲了如何从传统的卷积演化到深度可分离卷积,并提出了Xception架构。
一、从传统卷积到深度可分离卷积:
传统的卷积一系列卷积串行堆叠在一起,用来提取特征,这样做的好处是能让特征图不同的通道上空间关系建立联系,因为每个输出的通道都是由输入特征图上所有通道上空间信息的融合,典型的网络架构比如VGG,如下:
后来,Inception想让特征图中的通道部分解耦,即将互相独立的信息分别放入不同的特征图,这样可以降低过拟合,于是当特征图输入的时候,就使用了不同的卷积核来提取特征,输出几个相互独立的特征图,这样每个特征图提取到的特征都是不同的,且是解耦的,如下图: