AI大模型：（二）3.2 Llama-Factory微调训练deepseek-r1实践

hay_lee

已于 2025-06-08 22:19:05 修改

阅读量392

点赞数 1

分类专栏： AI大模型开发文章标签：人工智能

于 2025-06-07 23:18:30 首次发布

本文链接：https://blog.csdn.net/yztezhl/article/details/148459644

版权

AI大模型开发专栏收录该内容

13 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

5.1.Llama-Factory数据格式

1.环境准备

我们使用python虚拟环境做隔离，防止包冲突：

python -m venv python_model       # 创建名为python_model的虚拟环境
source python_model /bin/activate  # 激活环境（Linux/macOS）
 
python_model\Scripts\activate.bat  # 激活环境 windows

2.模型下载

训练时选择模型大小，需要考虑gpu显存、模型存储（存储一般现在存储资源也不贵，也很大，一般都够）：

2.1.显存计算

gpu显存计算公式：</

了解本专栏

超级会员免费看