(新手亲测有效)在消费级GPU上本地LoRA微调chatGLM-6B（FP16）

韬小志

已于 2024-02-23 20:26:47 修改

阅读量3k

点赞数 66

分类专栏：大模型文章标签：语言模型人工智能

于 2024-02-20 13:56:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41784510/article/details/135916874

版权

大模型专栏收录该内容

10 篇文章

订阅专栏

本文介绍了如何在消费级GPU上部署和微调chatGLM-6B的FP16版本，包括硬件和软件环境设置，以及遇到并解决的torch.OutOfMemoryError和ValueError问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在新手在消费级GPU上本地部署chatGLM-6B-CSDN博客文章中介绍了本地部署chatGLM-6B的过程，本文在此基础上实现对chatGLM-6B（FP16）的LoRA本地微调。

硬件、软件环境的需求，如下所示，具体部署方式请参考如下：

一、硬件要求

1、理论需求

硬盘空间：可用空间不小于40G；
显存要求：本人选用的ChatGLM-6B是FP16精度的，运行代码需要不少于14G的显存；后续要进行进一步的LoRA微调的话，显存最好不小于24G。如果硬件条件受限的话，可以考虑下载INT8或INT4量化后的ChatGLM-6B模型。

2、本人配置

本人针对FP16精度的ChatGLM-6B进行部署，暂未尝试INT8、INT4量化模型。

GPU：NVIDIA GeForce RTX 3090

CPU：Intel(R) Core(TM) i9-10980XE CPU @ 3.00GHz

二、软件环境

1、本人配置

ubuntu20.04

python 3.10.13

numpy==1.26.3

cuda:11.3

torch==2.1.2+cu121

transformers==4.37.1

peft==0.3.0

三、微调过程

微调过程，参考文章LLM - ChatGLM-6B Lora 微调与推理_chatglm2-6b训练lora-CSDN博客，作为一个新手小白的我，按照这篇文章成功完成了在消费级GPU上本地LoRA微调chatGLM-6B。

四、过程中的bug解决

1、在用显存24G的3090采用LoRA微调ChatGLM-6B（FP16）时报错torch.OutOfMemoryError:CUDA out of Memory.

解决办法详见：(新手亲测有效)bug解决：在用显存24G的3090采用LoRA微调ChatGLM-6B（FP16）时报错torch.OutOfMemoryError:CUDA out of Memory._chatglm2-6b cuda out of memory-CSDN博客文章浏览阅读358次，点赞9次，收藏8次。在解决了alueError: Attempting to unscale FP16 gradients. 和 AttributeError: 'ChatGLMTokenizer' object has no attribute 'sp_tokenizer'. Did you mean: '_tokenize'?这两个bug后，在GPU0上运行时，不再有torch.OutOfMemoryError:CUDA out of Memory.报错。_chatglm2-6b cuda out of memoryhttps://blog.csdn.net/weixin_41784510/article/details/135916265?spm=1001.2014.3001.5501

2、ValueError: Attempting to unscale FP16 gradients. 反复出现的问题

解决办法详见：（新手亲测有效）bug解决：ValueError: Attempting to unscale FP16 gradients. 反复出现的问题。-CSDN博客文章浏览阅读849次，点赞25次，收藏16次。在运用LoRA对ChatGLM-6B（FP16）大语音模型时，遇到了bug1：ValueError: Attempting to unscale FP16 gradients. 和 bug2： AttributeError: 'ChatGLMTokenizer' object has no attribute 'sp_tokenizer'. Did you mean: '_tokenize'? ，经过一波挫折后，终于解决，把解决的途径总结分享给大家。https://blog.csdn.net/weixin_41784510/article/details/135914663 朋友们，点赞收藏，不迷路啊！

博客等级

码龄7年

19
原创

329
点赞

262
收藏

270
粉丝

关注

私信

热门文章

分类专栏

大模型 10篇
C++ 2篇
PYTHON 5篇

最新评论

（新手亲测有效）bug解决：ValueError: Attempting to unscale FP16 gradients. 反复出现的问题。
编程晓菜狗: 但是有代码会检测peft的版本吧，这怎么办
（亲测好用-真心值得收藏）LoRA本地微调chatGLM-6B可用的数据集（LLM基础数据是2023年9月之前的）
CSDN-Ada助手: 恭喜您写了第13篇博客，看标题好像是关于LoRA本地微调可用的数据集，这个话题听起来很有意思呢！继续保持创作的热情和努力，让更多人受益于您的分享。或许在将来的文章中，可以尝试探讨一些实际案例或者应用场景，让读者更加深入地了解这个领域。期待您的下一篇作品！愿您在创作的路上不断进步，谦虚地分享自己的见解。
python sorted()、切片、TypeError: ‘int‘ object is not iterable——油腻大叔的无奈
CSDN-Ada助手: 恭喜大叔写了这么有趣的博客！看到标题我就忍不住点进来了。对于Python的sorted()、切片和TypeError错误，大叔的解释和分析都很到位，让我受益匪浅。希望大叔可以继续分享更多关于Python的知识，并且可以考虑写一些实用的案例或者项目经验分享，这样可以让读者更好地理解这些知识。期待大叔的下一篇博客！
python集合set可以去除重复元素、““.join——油腻大叔的无奈
CSDN-Ada助手: 恭喜博主写了第9篇博客，内容涵盖了python集合set的去除重复元素和“.join”的使用，让读者受益匪浅。希望博主能够继续坚持创作，分享更多有趣的技术内容。如果可能的话，可以考虑深入探讨一些高级的python技巧或是与其他编程语言的交叉应用，期待博主的下一篇作品。谢谢！
python for循环等简单bug解决记录-油腻大叔的无奈
CSDN-Ada助手: 恭喜油腻大叔持续创作，分享了关于Python for循环等简单bug解决的经验，对于初学者来说，这些记录非常有帮助。希望油腻大叔能够继续分享更多关于Python编程的经验和技巧，也可以尝试写一些实际项目中遇到的挑战和解决方案，让读者更深入地了解Python的应用。期待您更多的精彩内容，加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。