深度学习（CV）显存占用分析

最新推荐文章于 2024-07-06 19:34:24 发布

正则化

最新推荐文章于 2024-07-06 19:34:24 发布

阅读量3.7k

点赞数 6

分类专栏：深度学习笔记

本文链接：https://blog.csdn.net/weixin_41519463/article/details/100678938

版权

47 篇文章 10 订阅

订阅专栏

一般来说，占用显存大的并不是输入图像，而是神经网络中的中间变量以及使用optimizer算法时产生的巨量的中间参数。参考https://oldpan.me/archives/how-to-calculate-gpu-memory

占用显存大概分以下几类：

1、假如输入的图像大小为 3 x 224 x 224 ，batch_size=16 ，数据用的是float32，每个数字占用4B，那么输入部分所占用的显存为16 x 3 x 224 x 224 x 4B =9.1875 MB

2、一个(256,3,100,100)-(N,C,H,W)的卷积核FloatTensor所占的空间为256 x 3 x 100 x 100 x 4B = 31M

通常一个模型占用的显存也就是两部分：

以Vgg16为例：

（图中默认用1B空间来存储数据，实际应该是4B，所以应该多乘以4才对）

左边的memory值代表：图像输入进去，图片以及所产生的中间feature map所占的空间。

右边的params值代表：模型的参数量，比如一个Conv对应(3x3x3)x64的参数量，因为它是一个3x3的卷积核。卷积核的权重值也要放在显存上，所以也占用空间。而poolong层是没有参数的，只是定义了计算方式而已。

总结一下，模型中会占用显存的有：

占用显存：

不占用显存：

具体计算方式：

优化除了算法层的优化，最基本的优化无非也就一下几点：

关注

专栏目录