普通卷积与深度可分离卷积的区别

最新推荐文章于 2024-03-26 11:48:07 发布

知道的都知道不知道的慢慢了解

最新推荐文章于 2024-03-26 11:48:07 发布

阅读量713

点赞数

分类专栏：目标检测文章标签：深度学习计算机视觉 cnn

原文链接：https://blog.csdn.net/m0_37799466/article/details/106054111

版权

目标检测专栏收录该内容

7 篇文章 1 订阅

订阅专栏

普通卷积与深度可分离卷积的区别

本文来源于：普通卷积与深度可分离卷积的区别

1、普通卷积的卷积方式

原始图像是二维的，大小是12x12。由于是RGB格式的，所以有三个通道，这相当于是一个3维的图片。其输入图片格式是：12x12x3。滤波器窗口大小是5x5x3。这样的话，得到的输出图像大小是8x8x1（padding模式是valid）。

在这里插入图片描述

对于一张12×12像素、三通道（shape为12×12×3）的图像，经过5×5卷积核的卷积层，卷积核的通道应该和输入图像的通道数相同，其卷积核个数决定了最后的输出特征图个数，就是输出通道；假设输出通道数为1，则卷积核shape为3×5×5×1，最终输出1个Feature Map，如果有same padding则尺寸与输入层相同（12×12x1），如果没有则为尺寸变为（8×8x1）：12x12x3 * 5x5x3x1 => 8x8x1

普通卷积运行正常卷积过程时，一个卷积核只能得到一个特征，如上图所示，一个卷积核3x5x5可以得到的输出特征图为8x8x1，仅仅提取到了图片的一个属性，如果希望获取更多的属性，则需要更多的滤波器。如果希望获取图片更多的属性，譬如要提取256个属性，如下图所示：
在这里插入图片描述

12x12x3 * 5x5x3x256 => 8x8x256，可以创建256个卷积核来创建256个8x8x1图像，然后将它们堆叠在一起便可创建8x8x256的图像输出。
正常卷积的问题在于，它的卷积核是针对图片的所有通道设计的（通道的总数就是depth）。那么，每要求增加检测图片的一个属性，卷积核就要增加一个。所以正常卷积，一个正常卷积层的完整卷积核格式应该为（输入通道数x卷积核高x卷积核宽）；卷积参数的总数=属性的总数x卷积核的大小。

2、深度可分离卷积

深度可分离卷积的方法有所不同。正常卷积核是对3个通道同时做卷积。也就是说，3个通道，在一次卷积后，输出一个数。
深度可分离卷积分为两步：
（1）用三个卷积对三个通道分别做卷积，这样在一次卷积后，输出3个数。
（2）这输出的三个数，再通过一个1x1x3的卷积核（pointwise核），得到一个数。所以深度可分离卷积其实是通过两次卷积实现的。
第一步，对三个通道分别做卷积，输出三个通道的属性：
在这里插入图片描述

具体运算过程如下所示：
在这里插入图片描述

第二步，用卷积核1x1x3对三个通道再次做卷积，这个时候的输出就和正常卷积一样，是8x8x1：
在这里插入图片描述

这步就是正常的卷积过程，只是卷积核大小为（3x1x1）,一个卷积核得到一个特征图；8x8x3 * 1x1x3x1 => 8x8x1。
如果要提取更多的属性，则需要设计更多的1x1x3卷积核心就可以(图片引用自原网站。感觉应该将8x8x256那个立方体绘制成256个8x8x1，因为他们不是一体的，代表了256个属性)：
在这里插入图片描述