计算CNN的模型的算力FLOPS

xidaoliang123

已于 2022-05-13 08:13:33 修改

阅读量1.1w

点赞数 6

分类专栏：学习笔记文章标签： FLOPS VGG19 resnet50 卷积卷积层参数计算

于 2019-03-05 18:01:03 首次发布

本文链接：https://blog.csdn.net/xidaoliang/article/details/88191910

版权

学习笔记专栏收录该内容

28 篇文章 1 订阅

订阅专栏

YOLOv3中的有一输入日志显示了BFLOPS，代表了这一卷积层的算力具体有多少。下面是我输入的前面38层的日志;

layer filters size input output
0 conv 32 3 x 3 / 1 416 x 416 x 3 -> 416 x 416 x 32 0.299 BFLOPs
1 conv 64 3 x 3 / 2 416 x 416 x 32 -> 208 x 208 x 64 1.595 BFLOPs
2 conv 32 1 x 1 / 1 208 x 208 x 64 -> 208 x 208 x 32 0.177 BFLOPs
3 conv 64 3 x 3 / 1 208 x 208 x 32 -> 208 x 208 x 64 1.595 BFLOPs
4 res 1 208 x 208 x 64 -> 208 x 208 x 64
5 conv 128 3 x 3 / 2 208 x 208 x 64 -> 104 x 104 x 128 1.595 BFLOPs
6 conv 64 1 x 1 / 1 104 x 104 x 128 -> 104 x 104 x 64 0.177 BFLOPs
7 conv 128 3 x 3 / 1 104 x 104 x 64 -> 104 x 104 x 128 1.595 BFLOPs
8 res 5 104 x 104 x 128 -> 104 x 104 x 128
9 conv 64 1 x 1 / 1 104 x 104 x 128 -> 104 x 104 x 64 0.177 BFLOPs
10 conv 128 3 x 3 / 1 104 x 104 x 64 -> 104 x 104 x 128 1.595 BFLOPs
11 res 8 104 x 104 x 128 -> 104 x 104 x 128
12 conv 256 3 x 3 / 2 104 x 104 x 128 -> 52 x 52 x 256 1.595 BFLOPs
13 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs
14 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs
15 res 12 52 x 52 x 256 -> 52 x 52 x 256
16 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs
17 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs
18 res 15 52 x 52 x 256 -> 52 x 52 x 256
19 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs
20 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs
21 res 18 52 x 52 x 256 -> 52 x 52 x 256
22 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs
23 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs
24 res 21 52 x 52 x 256 -> 52 x 52 x 256
25 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs
26 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs
27 res 24 52 x 52 x 256 -> 52 x 52 x 256
28 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs
29 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs
30 res 27 52 x 52 x 256 -> 52 x 52 x 256
31 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs
32 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs
33 res 30 52 x 52 x 256 -> 52 x 52 x 256
34 conv 128 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 128 0.177 BFLOPs
35 conv 256 3 x 3 / 1 52 x 52 x 128 -> 52 x 52 x 256 1.595 BFLOPs
36 res 33 52 x 52 x 256 -> 52 x 52 x 256
37 conv 512 3 x 3 / 2 52 x 52 x 256 -> 26 x 26 x 512 1.595 BFLOPs
38 conv 256 1 x 1 / 1 26 x 26 x 512 -> 26 x 26 x 256 0.177 BFLOPs
根据darkent代码中给出的计算公式(2.0 * l.n * l.size*l.size*l.c/l.groups * l.out_h*l.out_w)/1000000000.其中n属于当前层输出的卷积核的个数，size为卷积核的尺寸大小，c为当前网络层的通道数即输入卷积核的大小，groups一般默认为1，out_h和out_w为输出feature map的大小，因此第一层卷积的浮点数运算次数为2.0*32*3*3*3/1*416*416/1000000000.=0.299BFLOP依次计算以下的卷积层可以得出上图中的结果。

这里的BFLOPs表示每次卷积有多少次十亿次的浮点数运算，将各个层的BFLOPs加起来就是表示该模型的运算复杂度，侧面反映出了该模型的运算速度。

解释下上述公式各个的意义：

2.0 表示一次乘法和一次加法浮点运算

l.n表示卷积核数目

l.size表示卷积核大小(size*size)

l.c表示待卷积图像的个数

l.out_h和l.out_w表示卷积后图像的大小，也等于完成某个卷积核扫描完该图像所需要卷积次数。它取决于输入图像大小，卷积核大小，stride，以及pad等因素，其计算公式如下：(l.h + 2*l.pad - l.size) / l.stride + 1; (l.w + 2*l.pad - l.size) / l.stride + 1

PS：网上查找到的关于卷积层的参数及FLOPS的方法有很多种，与darknet中的计算方法不太一样。

按照上述的计算方法，计算了openpose算法中特征提取层的算力，包括VGG19的前面10层和openpose自己构建的两层

每一层的BFLOPS按照上述计算方式如下图所示

接下来要计算VGG16、resnet50等典型网络结构的BFLOPS

通过一上午的努力，终于按照计算公式整理了各个经典网络的结构的FLOPs，在整理过程中重新理解了下卷积层参数的计算方法和浮点数的运算方法

参考VGG16学习笔记_dta0502的博客-CSDN博客_vgg16原文。如下图所示;

图片中最后一列的参数的计算方法为（输入卷积核的大小+1）*卷积核个数。比如第一层1792= （3*3*3+1）*64，这里的卷积核个数为当前层的卷积核的通道数。要计算FLOPs的话需要再乘以当前层的输出，但是不知道为什么darknet给出的公式需要乘以2。如果还是不明白可以参考链接卷积神经网络中的参数计算 - hejunlin - 博客园

以下是resnet50的网络的机构并参考计算了BFLOPs

xidaoliang123

关注

6
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
计算CNN的模型的算力FLOPS

YOLOv3中的有一输入日志显示了BFLOPS，代表了这一卷积层的算力具体有多少。下面是我输入的前面38层的日志;layerfilters size input output0 conv 32 3 x 3 / 1 416 x 416 x 3 -&gt; 416 x 416 x 32 0.299 BFLOPs1 conv 64 3 x 3 ...
复制链接

扫一扫

专栏目录