面经：卷积层计算量

最新推荐文章于 2024-04-14 08:30:14 发布

maocaisheng

最新推荐文章于 2024-04-14 08:30:14 发布

阅读量971

点赞数 2

分类专栏：机器学习文章标签：卷积层

原文链接：https://www.cnblogs.com/qinduanyinghua/p/11302618.html

版权

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

转自
深度学习之（经典）卷积层计算量以及参数量总结（考虑有无bias，乘加情况）
对公式重新美化了一下。

1、卷积操作如下：

http://cs231n.github.io/assets/conv-demo/index.html

假设卷积层的输入特征图大小为 $C_{in} \times H \times W$ , 卷积核大小为 $K_1 \times K_2$ , padding = $P_1 \times P_2$ , stride = $S_1 \times S_2$ , filter 数目为 $C_{out}$ 。

输出的特征图大小为 $C_{out} \times H_{out} \times W_{out}$ , 其中
$H_{out} = \lfloor (H - K_1 + 2P_1) / S_1\rfloor + 1 \\ W_{out} = \lfloor (W - K_2 + 2P_2) / S_2\rfloor + 1$
$\lfloor \cdot\rfloor$ 表示向下取整。

2、计算量分析

只考虑乘法计算量：

为了得到输出的特征图的某一个位置的像素值，需要 $C_{in} \times K_1 \times K_2$ 次乘法操作（三维的卷积），而特征图总共有 $C_{out} \times H_{out} \times W_{out}$ 个像素，因此总计算量为
$C_{out} \times H_{out} \times W_{out} \times ( C_{in} \times K_1 \times K_2)$

同时考虑乘法和加法计算量：

1）bias=true,即考虑偏置的情况

乘法操作计算量：

为了得到输出的特征图的某一个位置的像素值，需要 $C_{in} \times K_1 \times K_2$ 次乘法操作，而特征图总共有 $C_{out} \times H_{out} \times W_{out}$ 个像素，因此总计算量为
$C_{out} \times H_{out} \times W_{out} \times ( C_{in} \times K_1 \times K_2)$
加法操作计算量：

为了得到输出的特征图的某一个位置的像素值，需要 $C_{in} \times (K_1 \times K_2 - 1))+ (C_{in} - 1) + 1 = C_{in} \times K_1 \times K_2$ 次加法操作，可以看成三部分，第一部分表示在某一个通道进行一个 $K_1 \times K_2$ 大小的卷积操作需要 $(K_1 \times K_2 - 1)$ 次加法（n个数的和只需n-1次加法），有 $C_{in}$ 个通道，故 $C_{in} \times (K_1\times K_2 - 1)$ 次加法，每个通道都卷积后，得到 $C_{in}$ 个数，接下来需要有 $C_{in} - 1$ 次加法，最后加上bias又1次加法。而特征图总共有 $C_{out} \times H_{out} \times W_{out}$ 个像素，因此总加法计算量为
$C_{out} \times H_{out} \times W_{out} \times ( C_{in} \times K_1 \times K_2)$