llamafactory报错：双卡4090GPU，训练qwen2.5:7B、14B时报错GPU显存不足（out of memory），轻松搞定~~~

Ven%

已于 2024-12-27 16:38:37 修改

阅读量2k

点赞数 7

分类专栏：深度学习基础动手 Ubuntu 深度学习速通系列文章标签：服务器运维 llama 深度学习人工智能 python 机器学习

于 2024-12-27 15:28:47 首次发布

本文链接：https://blog.csdn.net/weixin_51455837/article/details/144770044

版权

深度学习速通系列同时被 3 个专栏收录

63 篇文章

订阅专栏

深度学习基础动手

36 篇文章

订阅专栏

Ubuntu

26 篇文章

订阅专栏

实际问题场景：

使用llamafactory进行微调qwen2.5 7B和14B的大模型时，会出现out of memory的报错。尝试使用降低batch_size（原本是2，现在降到1）的方式，可以让qwen2.5:7B跑起来，但时不时会不稳定，还是会报这个错误；微调14B的话，直接就报错了，根本跑起来。（显卡配置为两张23G的4090显卡，显存一共46G）目测lora微调显存的大小是模型本身大小的3倍以上，才能正常跑起来。

解决办法:

去qwen的官网找到下载ds_config_zero3.json这个文件
https://github.com/QwenLM/Qwen/blob/main/finetune/ds_config_zero3.json
将文件放在llamafactory目录下
编辑ds_config_zero3.json这个文件，将device改成cpu即可

"zero_optimization": {
        "stage": 3,
        "offload_optimizer": {
            "device": "cpu",
            "pin_memory": true
        },
        "offload_param": {
            "device": "cpu",
            "pin_memory": true
        },