深度学习：卷积神经网络之移动网络（MobileNet）

最新推荐文章于 2024-01-27 12:36:58 发布

ShadyPi

最新推荐文章于 2024-01-27 12:36:58 发布

阅读量1.3k

点赞数 1

分类专栏：深度学习与神经网络文章标签：深度可分离卷积移动网络 EfficientNet 计算量卷积运算

本文链接：https://blog.csdn.net/ShadyPi/article/details/122828215

版权

深度学习与神经网络专栏收录该内容

19 篇文章 1 订阅

订阅专栏

可以在手机上运行的CNN，所以称之为移动网络，主要是运用了深度可分离卷积（depthwise-separable convolution）降低了运算量使得网络能在低算力情境下运行。

深度可分离卷积

先看看普通的的卷积运算：
在这里插入图片描述
上图展示的是一个 $6\times 6\times 3$ 的输入矩阵经过 $5$ 个 $3\times 3\times 3$ 的过滤器得到 $4\times 4\times 5$ 的输出矩阵需要的计算，次数大概是过滤器大小乘以输出矩阵大小，即 $3\times 3\times 3\times 4\times 4\times 5=2160$ 次。对于一个 $6\times 6$ 像素的图片尚且如此，不难想象在正常图片甚至高清大图上应用卷积的计算量。

为了减少计算，深度可分离卷积应运而生。

首先，我们的过滤器不再是 $3\times 3\times 3$ 的整体，而是3个 $3\times 3$ 的过滤器，区别就在于现在每个过滤器只与对应通道的输入矩阵卷积，也就是所谓在深度上分离：
在这里插入图片描述
所以只需要运算 $3\times 3\times 4\times 4\times 3=432$ 次，省掉了过滤器个数这个维度。

下一步，则是通过一个 $1\times 1$ 过滤器，这一步用的就是正常卷积，采用5个 $1\times 1$ 过滤器得到 $4\times 4\times 5$ 的输出矩阵：
在这里插入图片描述
这一步计算需要 $1\times 1\times 3\times 4\times 4\times 5=240$ 次乘法。

所以深度可分离卷积只会用到 $432 + 240 = 672$ 次运算，只有普通卷积的 $\frac{1}{3}$ 不到。更一般的，对于滤波器大小为 $f\times f\times n_c$ ，个数为 $n_c'$ ，输出矩阵大小为 $n\times n\times n_c'$ 的卷积运算，正常计算需要
$f\times f\times n_c\times n\times n\times n_c'=f^2n_cn^2n_c'$ 次，而采用深度可分离卷积只需要
$f\times f\times n\times n\times n_c+1\times 1\times n_c\times n\times n\times n_c'=f^2n_cn^2+n_cn^2n_c'=n_cn^2(f^2+n_c')$ 次，仅为普通卷积的 $\frac{f^2+n_c'}{f^2n_c'}=\frac{1}{f^2}+\frac{1}{n_c'}$ 倍。而一般而言， $n_c'$ 要远大于 $f^2$ ，因此运算量差不多只占 $\frac{1}{9}$ 或 $\frac{1}{25}$ 。