关于 FLOPS、FLOPs、参数量的相关计算

乄洛尘

已于 2023-09-12 11:59:45 修改

阅读量1.3w

点赞数 46

分类专栏： Pytorch 文章标签：计算机视觉深度学习人工智能

于 2022-03-30 19:07:40 首次发布

本文链接：https://blog.csdn.net/qq_38929105/article/details/123847385

版权

Pytorch 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

关于 FLOPS、FLOPs、参数量的相关计算

一、FLOPS
二、FLOPs
三、Github 自动计算 Parameters、MACs 的工具
四、尚未完结，需要时再补充~

写在前面
最近找到一些计算FLOPs的文章，奈何全是水文，讲都讲不清楚，完完全全的究极缝合怪。因此，这里准备彻底搞懂。

参考：CNN 模型所需的计算力（flops）和参数（parameters）数量是怎么计算的？

2023.3.12更新：

thop 库计算 MACs 和 FLOPs 示例代码
最新一篇参数量计算博文，无需安装 pip 包：三行代码计算模型参数量

一、FLOPS

FLOPS：全称：FLoating point Operations Per Second的缩写，即每秒浮点运算次数，或表示为计算速度。是一个衡量硬件性能的指标。通俗点讲显卡算力，对应英伟达官网的那些：GPU算力排行榜。

二、FLOPs

这才是本文的重点，FLOPs：FLoating point OPerationS 即浮点计算次数，包含乘法和加法，只和模型有关，可以用来衡量其复杂度。多提一嘴，论文里面的FLOPs有的计算也并不明确，包括很多 Github 开源代码里面采用的 MACs，也就是考虑一次乘+加法运算为一次 MAC，粗略换算的话： $\text{FLOPs} = 2\times\text{MAC}$ 。建议发表的论文还是按照 FLOPs 来给出，因为我看的大部分文章都是用的这个，而不是 MACs。

2.1 2D 卷积运算

FLOPs

就单纯的 2D 卷积而言，举例：

$\text{Conv2d}(C_{out}, C_{in}, kernel= K, stride= S, padding= P, bias=False)$
输入 Feature map： $B, C_{in}, W_{in}, H_{in})$ ，输出 Feature map： $B, C_{out}, W_{out}, H_{out})$ ，计算如下：
$\text{FLOPs}=\left(2\times{C_{in}}\times{K}^2-1\right)\times{W_{out}}\times{H_{out}}\times{C_{out}}$
注意 (.) 里面的 -1 ，如果 bias = True，则不需要 -1。将 (.) 拆分为乘法和加法：
$\text{FLOPs}=\left[\left({C_{in}}\times{K}^2\right)+\left({C_{in}}\times{K}^2-1\right)\right]\times{W_{out}}\times{H_{out}}\times{C_{out}}$
第一个 (.) 里面是乘法，第二个是加法，如果 n 个数相加，做 n - 1 次加法运算，因此当 bias = True 时，刚好和 -1 抵消掉。

Parameters

参数量的计算要简单些： $\text{Paras}=K\times{K}\times{C_{in}}\times{C_{out}}+C_{out}$
同样注意：如果 bias = True， $C_{out}$ ，如果 bias = False，去掉 $C_{out}$ 。

2.2 全连接层

FLOPs

线性全连接层，举例：
$Liner(C_{in}, C_{out}, bias = False)$ ，输入 sequence ： $B, num, C_{in})$ ，输出 sequence： $B, num, C_{out})$ ，计算如下：
$\text{FLOPs}=B\times[\left(2\times{C_{in}}-1\right)\times{C_{out}}]$
其中 $2$ 代表乘法和加法。同上，当 bias = False 时，-1，bias = True时，无 -1。

Parameters

全连接层参数： $\text{Paras}={C_{in}}\times{C_{out}}+C_{out}$
同样注意：当 bias = True， $C_{out}$ ，当 bias = False，去掉 $C_{out}$ 。

2.3 BatchNorm2D 层

FLOPs

由于 BatchNorm2D 层经常和卷积层连用，参考：论文阅读笔记：看完也许能进一步了解Batch Normalization，而在程序里面，这两个可以合并运算，因此不会增加 FLOPs。当然如果是 BatchNorm2D 在前，卷积在后，通用需要考虑 BatchNorm2D 层。

Parameters

对于每一个通道来说，可学习的参数有 2 个，动量 $\gamma$ 、动量偏移 $\beta$ 。

2.4 激活层

对于 ReLU 来说，由于其本身性质，不涉及 MAC 运算，因此只考虑 FLOPs。而FLOPs 相对来说较小，所以一般不计算或者想其他办法计算。提一嘴，在推理时哪会用得到sigmoid呢。
激活层没有参数。

三、Github 自动计算 Parameters、MACs 的工具

3.1 thop

官网：Github
安装：

pip install thop

使用举例：

import torch
from torchvision.models import resnet50
from thop import profile
model = resnet50()
input = torch.randn(1, 3, 224, 224)
macs, params = profile(model, inputs=(input, ))

print("MACs=", str(macs / 1e9) + '{}'.format("G"))
print("MACs=", str(macs / 1e6) + '{}'.format("M"))

自定义计算规则举例：

import torch
from thop import profile
class YourModule(nn.Module): # 自定义模型
def count_your_model(model, x, y):  # 自定义计算规则

input = torch.randn(1, 3, 224, 224)
macs, params = profile(model, inputs=(input,),
custom_ops={YourModule: count_your_model})

print("MACs=", str(macs / 1e9) + '{}'.format("G"))
print("MACs=", str(macs / 1e6) + '{}'.format("M"))

优点：对于某个层的调试来说，很方便，比如 nn.Conv2D。
缺点：自定义的层，如 nn.Sequential()、nn.ModuleList() 这些容器层计算不了，需要自定义规则。

3.2 ptflops

官网：Github
安装：

pip install ptflops

使用举例：

import torch
from torchvision.models import resnet50
from ptflops import get_model_complexity_info
  
model = resnet50()
macs, params = get_model_complexity_info(model, (3, 200, 280), as_strings=True,
                                           print_per_layer_stat=True, verbose=True)
                                           
print("MACs=", str(macs / 1e9) + '{}'.format("G"))
print("MACs=", str(macs / 1e6) + '{}'.format("M"))

优点：对于某个层的调试来说，很方便，比如 nn.Conv2D这些。另外 print_per_layer_stat = True 可以打印每一层的结构
缺点：自定义的层，如 nn.Sequential()、nn.ModuleList() 这些容器层计算不了。另外输入没有 batch维度，给出 shape 即可。