(新手亲测有效)bug解决：在用显存24G的3090采用LoRA微调ChatGLM-6B（FP16）时报错torch.OutOfMemoryError:CUDA out of Memory.

最新推荐文章于 2025-05-08 08:29:02 发布

韬小志

最新推荐文章于 2025-05-08 08:29:02 发布

阅读量2.2k

点赞数 9

分类专栏：大模型文章标签： bug 人工智能语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41784510/article/details/135916265

版权

大模型专栏收录该内容

10 篇文章

订阅专栏

理论上，ChatGLM-6B（FP16）模型部署运行时需要大约13G的显存空间即可。在采用LoRA对ChatGLM-6B（FP16）进行微调时，显存空间会占用到20G多一点（参考LLM - ChatGLM-6B Lora 微调与推理_chatglm2-6b训练lora-CSDN博客），按照这个情况，显存为24G的3090显卡是足够对其运行的。

但是，在运行Chatglm_lora_tuning.py时出现的GPU（3090，显存24G）内存溢出（torch.OutOfMemoryError:CUDA out of Memory. Tried to allocate ......）的问题。

因为，这个bug太过于广泛了，当时本人没有搜索到直接的解决方法，有一些通过将模型进行INT8或INT4量化后，减少对GPU内存的需求进行解决的方法。基于文章开头的理论分析，本人认为不是FP16模型导致的问题，因此，没有通过更换量化模型的方式进行解决。由于本人的电脑有两张GPU，另一张仍然是24G的3090，只是其它应用对其内存占有率较低（相对于GPU0少占用几百兆），采用GPU1运行不再出现该问题，但是出现了ValueError: Attempting to unscale FP16 gradients. 和 AttributeError: 'ChatGLMTokenizer' object has no attribute 'sp_tokenizer'. Did you mean: '_tokenize'?等bug。

在解决了alueError: Attempting to unscale FP16 gradients. 和 AttributeError: 'ChatGLMTokenizer' object has no attribute 'sp_tokenizer'. Did you mean: '_tokenize'?这两个bug后，在GPU0上运行时，不再有torch.OutOfMemoryError:CUDA out of Memory.报错。

解决方法参考：（新手亲测有效）bug解决：ValueError: Attempting to unscale FP16 gradients. 反复出现的问题。-CSDN博客

博客等级

码龄7年

19
原创

331
点赞

265
收藏

270
粉丝

关注

私信

热门文章

分类专栏

大模型 10篇
C++ 2篇
PYTHON 5篇

展开全部收起

上一篇：: （新手亲测有效）bug解决：ValueError: Attempting to unscale FP16 gradients. 反复出现的问题。

下一篇：: (新手亲测有效)在消费级GPU上本地LoRA微调chatGLM-6B（FP16）

最新评论

（新手亲测有效）bug解决：ValueError: Attempting to unscale FP16 gradients. 反复出现的问题。
编程晓菜狗: 但是有代码会检测peft的版本吧，这怎么办
（亲测好用-真心值得收藏）LoRA本地微调chatGLM-6B可用的数据集（LLM基础数据是2023年9月之前的）
CSDN-Ada助手: 恭喜您写了第13篇博客，看标题好像是关于LoRA本地微调可用的数据集，这个话题听起来很有意思呢！继续保持创作的热情和努力，让更多人受益于您的分享。或许在将来的文章中，可以尝试探讨一些实际案例或者应用场景，让读者更加深入地了解这个领域。期待您的下一篇作品！愿您在创作的路上不断进步，谦虚地分享自己的见解。
python sorted()、切片、TypeError: ‘int‘ object is not iterable——油腻大叔的无奈
CSDN-Ada助手: 恭喜大叔写了这么有趣的博客！看到标题我就忍不住点进来了。对于Python的sorted()、切片和TypeError错误，大叔的解释和分析都很到位，让我受益匪浅。希望大叔可以继续分享更多关于Python的知识，并且可以考虑写一些实用的案例或者项目经验分享，这样可以让读者更好地理解这些知识。期待大叔的下一篇博客！
python集合set可以去除重复元素、““.join——油腻大叔的无奈
CSDN-Ada助手: 恭喜博主写了第9篇博客，内容涵盖了python集合set的去除重复元素和“.join”的使用，让读者受益匪浅。希望博主能够继续坚持创作，分享更多有趣的技术内容。如果可能的话，可以考虑深入探讨一些高级的python技巧或是与其他编程语言的交叉应用，期待博主的下一篇作品。谢谢！
python for循环等简单bug解决记录-油腻大叔的无奈
CSDN-Ada助手: 恭喜油腻大叔持续创作，分享了关于Python for循环等简单bug解决的经验，对于初学者来说，这些记录非常有帮助。希望油腻大叔能够继续分享更多关于Python编程的经验和技巧，也可以尝试写一些实际项目中遇到的挑战和解决方案，让读者更深入地了解Python的应用。期待您更多的精彩内容，加油！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。