卷积神经网络中的Separable Convolution

最新推荐文章于 2023-11-02 10:19:32 发布

丽宝儿

最新推荐文章于 2023-11-02 10:19:32 发布

阅读量3.3k

点赞数 4

分类专栏：零碎笔记

本文链接：https://blog.csdn.net/heruili/article/details/102909560

版权

本文介绍了卷积神经网络中用于降低运算量的Separable Convolution，它由Depthwise Convolution和Pointwise Convolution两步组成。Depthwise Convolution在二维平面内对每个通道独立卷积，Pointwise Convolution则负责通道间的组合，生成新的Feature map。通过这种方式，Separable Convolution的参数数量仅为常规卷积的约1/3，允许网络在保持参数量不变的情况下构建更深的结构。

摘要由CSDN通过智能技术生成

卷积神经网络中的Separable Convolution
卷积神经网络中的Separable Convolution
卷积神经网络在图像处理中的地位已然毋庸置疑。卷积运算具备强大的特征提取能力、相比全连接又消耗更少的参数，应用在图像这样的二维结构数据中有着先天优势。然而受限于目前移动端设备硬件条件，显著降低神经网络的运算量依旧是网络结构优化的目标之一。本文所述的Separable Convolution就是降低卷积运算参数量的一种典型方法。

常规卷积运算
假设输入层为一个大小为64×64像素、三通道彩色图片。经过一个包含4个Filter的卷积层，最终输出4个Feature Map，且尺寸与输入层相同。整个过程可以用下图来概括。
在这里插入图片描述

此时，卷积层共4个Filter，每个Filter包含了3个Kernel，每个Kernel的大小为3×3。因此卷积层的参数数量可以用如下公式来计算：

N_std = 4 × 3 × 3 × 3 = 108
Separable Convolution
Separable Convolution在Google的Xception[1]以及MobileNet[2]论文中均有描述。它的核心思想是将一个完整的卷积运算分解为两步进行，分别为Depthwise Convolution与Pointwise Convolution。

Depthwise Convolution
同样是上述例子，一个大小为64×64像素、三通道彩色图片首先经过第一次卷积运算，不同之处在于此次的卷积完全是在二维平面内进行，且Filter的数量与上一层的Depth相同。所以一个三通道的图像经过运算后生成了3个Feature map，