lora微调大模型Qwen2.5_32B

最新推荐文章于 2025-03-29 14:52:27 发布

Toady 元气满满

最新推荐文章于 2025-03-29 14:52:27 发布

阅读量3.2k

点赞数 26

分类专栏：大模型文章标签：深度学习人工智能 llama 语言模型

本文链接：https://blog.csdn.net/lft_happiness/article/details/144050121

版权

大模型专栏收录该内容

4 篇文章

订阅专栏

最近有在尝试用lora微调Qwen大模型，在这里主要记录下实践过程。Qwen模型下载可以去魔塔社区，我这里是提前下载好了放在/public/DownloadedModels下。LLamaFactory源码地址：GitHub - hiyouga/LLaMA-Factory: Unified Efficient Fine-Tuning of 100+ LLMs (ACL 2024)

1. 准备数据

（1）由于我微调的目的是为了评价某些KPI指标，所以我的准备数据的格式设置如下：

（2）数据准备好之后，将json文件上传到LLamaFactory项目的data目录下：

(为了方便操作，我将data目录下的数据移到examples下了)

注：我是上传之后将data.json改名SteelData.json了，内容不变。

（3）vi打开dataset_info.son文件，并在dataset_info.json文件里添加数据文件信息。

2. 设置lora微调时模型、数据位置

vi打开/LLaMA-Factory/examples/train_lora目录下的llama3_lora_sft.yaml文件：

这里需要设置Qwen模型位置，数据集的名称（这里用的是dataset_info中对steelData数据文件的命名）和微调模型的输出位置(为了方便操作，我把saves目录下也移到/LLaMA-Factory/examples目录下了)：

3. lora微调模型

（1）在examples目录下进行微调训练，这里需要切换到虚拟环境（具体要求可参考llamaFactory要求），FORCE_TORCHRUN=1 CUDA_VISIBLE_DEVICES=0,1，2，3 表示单机多卡训练。我这里微调Qwen2.5_32B一块卡是不够用的，最起码两块卡(我这里是A800的卡)。如果还报错，有可能就是卡还是不够。

我这里运行报错，经过多次尝试，我发现deepspeed方法对我是有效的。

（2）于是我在llama3_lora_sft.yaml文件中添加了deepspeed设置：

（3）添加完deepspeed之后，需要用pip 安装deepspeed，否则再次运行微调程序会显示没有deepspeed这个模块。我这里就不再安装了，截个安装好的图。

注：安装deepspeed的时候可能会报缺少nvvc错误，这个时候可以输入以下命令安装（亲测有效，昨天刚试成功）：

conda install cuda-nvcc -c conda-forge

（4）再次运行微调程序

(torch24) root@e70a6fd3f126:/data/LLaMA-Factory/examples# FORCE_TORCHRUN=1 CUDA_VISIBLE_DEVICES=0,1,2,3  llamafactory-cli train train_lora/llama3_lora_sft.yaml

运行结果如下：

（5）运行成功之后，可以看到saves/lora下有内容了：

4. 模型推理

（1）打开inference目录下的llama3_lora_sft.yaml文件，设置模型路径：

（2）运行模型推理命令

torch24) root@e70a6fd3f126:/data/LLaMA-Factory/examples# FORCE_TORCHRUN=1 CUDA_VISIBLE_DEVICES=0,1,2,3  llamafactory-cli chat inference/llama3_lora_sft.yaml

运行结果如下：

接下来就可以和大模型对话了。

(3) 测试微调结果

因为我数据中每次都是先计算平均值，所以这个结果说明模型是学习了，只不过效果不好，我还得继续调参数。还有不知道为什么最后又把输入数据重复了一遍，有朋友知道是为什么嘛？

5. 模型合并

（1）首先需要设置/examples/merge_lora目录下的文件llama3_lora_sft.yaml文件,如下图所示，我设置了使用的大模型位置，微调后的模型位置以及模型合并后的位置。

（2）设置完之后就可以运行模型合并程序了

(torch24) root@e70a6fd3f126:/data/LLaMA-Factory/examples# llamafactory-cli export merge_lora/llama3_lora_sft.yaml

运行结果如下：

运行完之后，modles/llama3_lora_sft目录下就有内容了：

以上便是最近lora微调大模型Qwen2.5_32B的实践过程了，希望可以帮助到大家~

感谢关注！！后续有关大模型的实践也将尽快更新~