模型大小、推理速度相关

最新推荐文章于 2024-06-27 23:55:14 发布

学学没完

最新推荐文章于 2024-06-27 23:55:14 发布

阅读量1.4k

点赞数 1

分类专栏：深度学习文章标签：卷积算法 python 深度学习

本文链接：https://blog.csdn.net/weixin_42907473/article/details/105728887

版权

深度学习专栏收录该内容

4 篇文章 3 订阅

订阅专栏

模型参数量（Params）和模型每秒浮点运算速度（Flops）

对卷积层而言

Params量计算公式： $K_h*K_w*C_in )*C_out$
Flops计算公式： $K_h*K_w*C_in*C_out )*(H_out*W_out)$
其中 $K_h$ 和 $K_w$ 代表了kernel的input_size， $C_in$ 是input feature map的channel数， $C_out$ 是output feature map的channel数, $H_out和W_out$ 分别代表了output feature map的size。

对于全连接层而言

Params量计算公式： $C_in*C_out$
Flops计算公式： $C_in*C_out$

FLOPS: floating point operations per second.每秒的浮点运算次数。

MADDs: 即MACCs（multiply-accumulate operations）:先乘起来再加起来的运算次数。

例如： $y = w [0] * x [0] + w [1] * x [1] + w [2] * x [2] + . . . + w [n - 1] * x [n - 1]$
w 和 x 都是向量，y 是标量。上式是全连接层或卷积层的典型运算。一次乘-加运算即一次乘法+一次加法运算，所以上式的 MACCs 是n 。
不过可以看到，加法运算的次数并非 n 而是 n-1 。但考虑 MACCs 时可以类比算法复杂度估算的 big-O ，即结果可以是近似的。
而换到 FLOPS 的情况，点积做了 2n-1 FLOPS，即 n-1 次加法和 n 次乘法。可以看到，MACCs 大约是 FLOPS 的一半。