深度学习笔记10-深度可分离卷积

Carrie_Lei

于 2024-08-21 21:06:11 发布

阅读量2.1k

点赞数 9

分类专栏：深度学习文章标签：深度学习笔记人工智能

本文链接：https://blog.csdn.net/finly4599/article/details/141402928

版权

31 篇文章

订阅专栏

深度可分离卷积（Depthwise Separable Convolution）是一种卷积操作，用于减小卷积神经网络中的计算复杂度和模型参数量。它主要用于深度学习中的卷积神经网络（CNN），特别是在移动设备和嵌入式系统中，以减少计算开销和内存需求。

深度可分离卷积将标准的卷积操作拆分为两个更简单的操作：

深度卷积（Depthwise Convolution）：
- 每个输入通道（或特征图）都使用一个单独的卷积核进行卷积操作。
- 这意味着每个输入通道只和一个卷积核进行卷积，没有跨通道的计算。
- 结果是每个输入通道会产生一个输出通道。
逐点卷积（Pointwise Convolution）：
- 使用 (1 $\times$ 1) 的卷积核，对深度卷积的输出进行进一步的处理。
- 这一操作用于混合深度卷积生成的输出通道，从而生成最终的输出通道。

深度卷积：对于输入的每个通道，使用一个 (k $\times$ k) 的卷积核进行卷积操作，其中 (k) 是卷积核的大小。
- 假设输入有 $C_{\text{in}}$ 个通道，深度卷积会有 $C_{\text{in}}$ 个卷积核，每个卷积核的大小为 $\times k$ 。
逐点卷积：使用 (1 $\times$ 1) 的卷积核进行卷积操作，用于将深度卷积的输出通道线性组合成所需的输出通道。
- 假设深度卷积的输出有 $C_{\text{out}}$ 个通道，逐点卷积的卷积核大小为 (1 $\times$ 1)，数量为 $C_{\text{out}}$ 个。

深度可分离卷积显著减少了标准卷积的计算量。假设输入特征图的尺寸为 (H \times W)，输入通道为 (C_{\text{in}})，输出通道为 (C_{\text{out}})，卷积核大小为 (k \times k)，那么：

标准卷积的计算量：
$\text{FLOPs}_{\text{standard}} = H \times W \times C_{\text{in}} \times C_{\text{out}} \times k^2$
深度可分离卷积的计算量：
- 深度卷积的计算量：
  $\text{FLOPs}_{\text{depthwise}} = H \times W \times C_{\text{in}} \times k^2$
- 逐点卷积的计算量：
  $\text{FLOPs}_{\text{pointwise}} = H \times W \times C_{\text{in}} \times C_{\text{out}}$
- 总计算量：
  $\text{FLOPs}_{\text{depthwise-separable}} = H \times W \times (C_{\text{in}} \times k^2 + C_{\text{in}} \times C_{\text{out}})$
与标准卷积相比，深度可分离卷积的计算复杂度显著降低，尤其是在 (C_{\text{out}}) 较大时，这种节省尤为明显。