AI大模型:(二)3.2 Llama-Factory微调训练deepseek-r1实践

目录

1.环境准备

2.模型下载

2.1.显存计算

2.2.存储计算

2.3.模型下载

3.Llama-Factory下载

4.数据准备

5.训练

5.1.Llama-Factory数据格式

5.2.配置外部数据集

5.3.运行Llama-Factory

5.4.UI界面配置

5.5.开始训练

5.6.评测

5.7.推理

5.8.导出模型


1.环境准备

     我们使用python虚拟环境做隔离,防止包冲突:

python -m venv python_model       # 创建名为python_model的虚拟环境
source python_model /bin/activate  # 激活环境(Linux/macOS)
 
python_model\Scripts\activate.bat  # 激活环境 windows

2.模型下载

训练时选择模型大小,需要考虑gpu显存、模型存储(存储一般现在存储资源也不贵,也很大,一般都够):

2.1.显存计算

gpu显存计算公式:</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hay_lee

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值