推理时显存

Ai君臣

于 2024-07-16 10:39:30 发布

阅读量241

点赞数 3

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuchenbaidu/article/details/140459858

版权

推理时显存的使用量确实会增加，主要原因是需要存储中间激活值和其他必要的数据。以下是推理时显存需求增加的主要原因：

模型权重：首先，模型的权重（即参数）会被加载到显存中。这部分的显存需求与模型文件的大小基本一致。
中间激活值：在进行推理时，每一层的输出（即激活值）也需要存储在显存中。这些中间激活值通常会占用大量显存，特别是在深度神经网络中。
输入数据和输出数据：输入数据需要加载到显存中，并且在进行推理时产生的输出数据也会占用显存。
批量大小（Batch Size）：批量大小直接影响显存的使用量。较大的批量大小会导致更多的中间激活值需要存储，从而增加显存需求。
其他内存开销：某些情况下，推理过程中还需要额外的内存开销，比如用于计算的临时变量、缓存等。

具体来说，当进行推理时，模型的每一层都会接收输入数据，进行计算，并产生输出，这些输出将作为下一层的输入。这种逐层计算和存储的过程需要显存。因此，显存的使用量会随着推理过程的进行而增加，直到所有层的计算完成。

下面是一个简单的例子来说明显存使用的变化：

加载模型：首先将模型加载到显存中，占用基本的显存（比如10GB）。
输入数据：然后将输入数据加载到显存中，占用额外的显存（比如1GB）。
中间激活值：在推理过程中，每一层的激活值都会占用显存，假设每层需要2GB显存，那么总共20层就需要40GB显存。
输出数据：最后，将输出数据存储到显存中，占用一定的显存（比如1GB）。

综合来看，推理过程中显存使用的总量将会是各部分需求的总和。因此，显存的使用量会显著增加，远超模型文件本身的大小。

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
推理时显存

具体来说，当进行推理时，模型的每一层都会接收输入数据，进行计算，并产生输出，这些输出将作为下一层的输入。因此，显存的使用量会随着推理过程的进行而增加，直到所有层的计算完成。推理时显存的使用量确实会增加，主要原因是需要存储中间激活值和其他必要的数据。综合来看，推理过程中显存使用的总量将会是各部分需求的总和。因此，显存的使用量会显著增加，远超模型文件本身的大小。较大的批量大小会导致更多的中间激活值需要存储，从而增加显存需求。：输入数据需要加载到显存中，并且在进行推理时产生的输出数据也会占用显存。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ai君臣 学会的就要教给人

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。