深度学习模型参数量/计算量和推理速度计算

最新推荐文章于 2023-03-16 21:15:56 发布

枫桥夜泊1003

最新推荐文章于 2023-03-16 21:15:56 发布

阅读量827

点赞数

分类专栏：深度学习文章标签：深度学习人工智能

原文链接：https://mp.weixin.qq.com/s/nknW

版权

深度学习专栏收录该内容

26 篇文章 1 订阅

订阅专栏

微信正文链接：https://mp.weixin.qq.com/s/nknW

1.FLOPs和Params计算

1.1概念理解

FLOPS：注意全大写，是floating point operations per second的缩写，意指每秒浮点运算次数，理解为计算速度。是一个衡量硬件性能的指标。

计算公式：
对卷积层：(K_h * K_w * C_in * C_out) * (H_out * W_out)
对全连接层：C_in * C_out

FLOPs：注意s小写，是floating point operations的缩写（s表复数），意指浮点运算数，理解为计算量。可以用来衡量算法/模型的复杂度。

Params：是指模型训练中需要训练的参数总数

模型参数量计算公式为：
对卷积层：（K_h * K_w * C_in）* C_out
对全连接层：C_in * C_out

注意：
1.params只与你定义的网络结构有关，和forward的任何操作无关。即定义好了网络结构，参数就已经决定了。FLOPs和不同的层运算结构有关。如果forward时在同一层（同一名字命名的层）多次运算，FLOPs不会增加
2.Model_size = 4*params  模型大小约为参数量的4倍