Depthwise卷积与Pointwise卷积

Good@dz

已于 2022-07-12 09:50:09 修改

阅读量648

点赞数 3

分类专栏：深度学习基础文章标签：计算机视觉深度学习 cnn

于 2021-12-02 20:21:59 首次发布

原文链接：https://blog.csdn.net/tintinetmilou/article/details/81607721?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163844511516780264099854%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=163844511516780264099854&biz_id=0&utm_m

版权

深度学习基础专栏收录该内容

73 篇文章 5 订阅

订阅专栏

Depthwise(DW)卷积与Pointwise(PW)卷积，合起来被称作Depthwise Separable Convolution(参见Google的Xception)，该结构和常规卷积操作类似，可用来提取特征，但相比于常规卷积操作，其参数量和运算成本较低。所以在一些轻量级网络中会碰到这种结构如MobileNet。

常规卷积操作

对于一张55像素的三通道彩色图片,经过33卷积核(假设输出通道为4,卷积核为4个333的卷积核),最终输出4个特征图.如果有same padding则尺寸与输入层相同(5*5).
在这里插入图片描述

Depthwise Separable Convolution

Depthwise Separable Convolution是将一个完整的卷积运算分解为两步进行,即Depthwise Convolution与Pointwise Convolution

Depthwise Convolution

不同于常规卷积操作,Depthwise Convolution的一个卷积核负责一个通道,一个通道只被一个卷积核卷积.上面所提及的常规卷积每个卷积核是同时操作输入图片的每个通道.

同样是对于一张55像素\三通道彩色输入图片(shape为55*3)，Depthwise Convolution首先经过第一次卷积运算，不同于上面的常规卷积，DW完全是在二维平面内进行。卷积核的数量与上一层的通道数相同（通道和卷积核一一对应）。所以一个三通道的图像经过运算后生成了3个Feature map(如果有same padding则尺寸与输入层相同为5×5)，如下图所示。

在这里插入图片描述
Depthwise Convolution完成后的Feature map数量与输入层的通道数相同，无法扩展Feature map。而且这种运算对输入层的每个通道独立进行卷积运算，没有有效的利用不同通道在相同空间位置上的feature信息。因此需要Pointwise Convolution来将这些Feature map进行组合生成新的Feature map。

Pointwise Convolution

Pointwise Convolution的运算与常规卷积运算非常相似，它的卷积核的尺寸为 1×1×M，M为上一层的通道数。所以这里的卷积运算会将上一步的map在深度方向上进行加权组合，生成新的Feature map。有几个卷积核就有几个输出Feature map。如下图所示。
在这里插入图片描述

总结

depthwise层，只改变feature map的大小，不改变通道数。。而Pointwise 层则相反，只改变通道数，不改变大小。这就是将常规卷积的做法拆分两步走
虽然使用深度可分离卷积可以让参数量变小，但是实际上用GPU训练的时候深度可分离卷积会非常的占用内存，并且比普通的3*3卷积要慢很多（实测）

Good@dz

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
Depthwise卷积与Pointwise卷积

Depthwise(DW)卷积与Pointwise(PW)卷积，合起来被称作Depthwise Separable Convolution(参见Google的Xception)，该结构和常规卷积操作类似，可用来提取特征，但相比于常规卷积操作，其参数量和运算成本较低。所以在一些轻量级网络中会碰到这种结构如MobileNet。常规卷积操作对于一张55像素的三通道彩色图片,经过33卷积核(假设输出通道为4,卷积核为4个333的卷积核),最终输出4个特征图.如果有same padding则尺寸与输入层相同(5*
复制链接

扫一扫

专栏目录