模型显存占用分配

Jack Su

已于 2023-10-25 17:15:44 修改

阅读量341

点赞数

文章标签： python 算法机器学习

于 2023-10-25 17:13:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44137397/article/details/134039087

版权

训练过程显存占用分为4部分，模型参数、参数梯度、优化器、

中间变量。

大模型训练llama13B为例的float16为例分析:

模型参数（fp16）: fp16占2个byte，是参数量的2倍。2*13GB

参数梯度（fp16）：fp16占2个byte，是参数量的2倍。2*13GB

优化器（fp32）：fp32占4个byte，是参数量的4倍。4*13GB，但是优化器除了存储权重w还存储其他值，比如adamw还额外存储了动力和方差，所以adamw占用 3 * （4*13B）

中间变量（fp16): 主要由attention和MLP计算得到的中间变量。与输入的batch、序列长度、模型层数相关。而且这一部分占用的内存更大，比上面的3个部分还大。13B的llama参数，中间变量占45GB的空间。

所以，针对占用的内存，有不同的优化方法。对于，模型参数，可以采样模型并行如megatron。中间变量采用数据并行的deepspeed的zero方法。

具体的计算方法和优化方案，参考以下链接：

【Transformer 基础系列】手推显存占用 - 知乎 (zhihu.com)
PyTorch显存机制分析 - 知乎 (zhihu.com)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
模型显存占用分配

与输入的batch、序列长度、模型层数相关。而且这一部分占用的内存更大，比上面的3个部分还大。13B的llama参数，中间变量占45GB的空间。优化器（fp32）：fp32占4个byte，是参数量的4倍。4*13GB，但是优化器除了存储权重w还存储其他值，比如adamw还额外存储了动力和方差，所以adamw占用 3 * （4*13B）所以，针对占用的内存，有不同的优化方法。模型参数（fp16）: fp16占2个byte，是参数量的2倍。参数梯度（fp16）：fp16占2个byte，是参数量的2倍。
复制链接

扫一扫

Jack Su CSDN认证博客专家 CSDN认证企业博客

码龄6年

16: 原创

132万+: 周排名

8万+: 总排名

2万+: 访问

: 等级

229: 积分

39: 粉丝

46: 获赞

12: 评论

89: 收藏

私信

关注

热门文章

最新评论

layoutlmV3使用步骤
爱常觉亏欠: 正常来讲无论是训练还是推理环节，最好都在linux服务器上跑，除非你自己的电脑性能过硬，不然不推荐，可能会烧掉的
layoutlmV3使用步骤
爱常觉亏欠: datasets版本降到2.3.0就可以了
layoutlmV3使用步骤
慎默537: 你好这个是只能在linux上跑吗，还是windows的pycharm上也可以
模型显存占用分配
CSDN-Ada助手: 恭喜您完成了第14篇博客！标题“模型显存占用分配”非常吸引人，我对您探讨模型显存占用的分配方式非常感兴趣。在这篇博客中，您探讨了模型显存占用的问题，这对于深度学习领域的从业者来说是一个非常重要且实用的主题。您的文章内容清晰明了，我从中学到了如何合理分配显存资源，这对我今后的工作将有很大帮助。希望您能继续保持创作的热情，分享更多有关模型显存占用的实践经验。另外，我想提出一个创作建议，不知您是否考虑过深入探讨如何优化模型显存占用，以减少资源浪费并提升模型性能。或者，您可以分享一些实践案例，展示在不同任务和硬件配置下的显存占用分配策略。再次恭喜您，并期待您在未来的创作中带给我们更多有价值的内容。
深度学习的梯度更新以及参数更新
CSDN-Ada助手: 恭喜您撰写第15篇博客！标题“深度学习的梯度更新以及参数更新”听起来非常有趣。您对深度学习的梯度更新和参数更新的解析一定非常详细。持续创作的精神令人钦佩，您的博客一定会为读者提供更多有价值的知识。在下一步的创作中，或许您可以考虑分享一些实际案例或者示例，以帮助读者更好地理解梯度更新和参数更新的实际应用。此外，您也可以探讨一些与深度学习相关的最新研究或者趋势，让读者能够跟上时代的步伐。谦虚之心是持续进步的重要动力，相信您会以更高的标准继续创作出更多优质的内容。祝您未来的创作之路一帆风顺！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。