本地模型微调、deepseek模型微调

最新推荐文章于 2025-04-16 17:47:07 发布

原创最新推荐文章于 2025-04-16 17:47:07 发布 · 668 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#模型微调 #大模型学习

学习记录专栏收录该内容

18 篇文章

订阅专栏

文章目录

一、下载CUDA
二、安装Pytorch
三、安装conda
四、安装LLaMA-Factory
五、下载模型
六、训练
问题

一、下载CUDA

https://developer.nvidia.com/cuda-12-6-2-download-archive

在这里插入图片描述

根据提示安装，安装完成后输入 nvcc -V 显示如下即安装成功

二、安装Pytorch

使用nvidia-smi查看CUDA版本

在这里插入图片描述

安装Pytorch 选择合适的版本安装

https://pytorch.org/

在这里插入图片描述

三、安装conda

下载地址：https://www.anaconda.com/download

在这里插入图片描述

配置环境变量

在这里插入图片描述

检查版本，有输出即安装成功

在这里插入图片描述

修改.condarc文件

envs_dirs:
  - F:\conda3\envs
pkgs_dirs:
  - F:\conda3\pkgs

四、安装LLaMA-Factory

项目地址：https://github.com/hiyouga/LLaMA-Factory

下载

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd ./LLaMA-Factory

创建环境、使用环境

conda create -n llama_factory python=3.10
conda activate llama_factory

安装依赖，运行llamafactory-cli version出现版本信息安装成功

pip install -e ".[torch,metrics]"
llamafactory-cli version

启动项目 llamafactory-cli webui

在这里插入图片描述

五、下载模型

下载地址：https://modelscope.cn/models

这里我下载的是 Qwen2.5-1.5B 模型

在这里插入图片描述

下载好后配置模型名称和路径

在这里插入图片描述

六、训练

设置数据路径

在这里插入图片描述

仿照data目录下alpaca_zh_demo.json格式注册自己的数据集，例如：

在这里插入图片描述

在训练页面选择该数据集，点击开始

在这里插入图片描述

训练完成

在这里插入图片描述

导出

在这里插入图片描述

问题

如果出现为检测到CUDA环境，可能是torch是cpu版本，需要先卸载在安装gpu版本

查看版本

import torch
print(torch.__version__)

在这里插入图片描述

重新安装

pip uninstall torch
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

在这里插入图片描述