本地搭建LLaMA-Factory环境进行大模型调优

hawk2014bj

已于 2024-05-18 23:37:57 修改

阅读量1.6k

点赞数 5

文章标签： llama llamafactory

于 2024-05-18 22:52:55 首次发布

本文链接：https://blog.csdn.net/hawk2014bj/article/details/138999760

版权

LLaMA Factory

LLaMA Factory快速对大模型进行快速调优，本文看一下如何本地搭建环境并调优，本文使用 ModelScope 社区中的模型，模型在国内，下载速度非常友好。

下载最新代码

## LLaMA Factory官方
git pull https://github.com/hiyouga/LLaMA-Factory

编译 Docker 并运行
我添加了USE_MODELSCOPE_HUB=1，代表从 ModelScope 拉模型，所以训练时候需要使用 ModelScope 的 ID。docker 文件稍微修改一下，添加 python 镜像，否则打包非常慢。

FROM nvcr.io/nvidia/pytorch:24.01-py3

WORKDIR /app

COPY requirements.txt /app/
RUN pip install -i https://mirrors.aliyun.com/pypi/simple -r requirements.txt

COPY . /app/
RUN pip install -i https://mirrors.aliyun.com/pypi/simple -e .[metrics,bitsandbytes,qwen]

VOLUME [ "/root/.cache/huggingface/", "/app/data", "/app/output" ]
EXPOSE 7860

CMD [ "llamafactory-cli", "webui" ]

docker build -f ./Dockerfile -t llama-factory:latest .
docke

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hawk2014bj

关注关注

5
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

本地部署 LLaMA-Factory

engchina的专栏

12-23

1771

本地部署LLaMA-Factory

基于autodl与llama-factory微调llama3（一）

2201_75499442的博客

06-23

870

基于本地数据集微调llama3

1 条评论您还未登录，请先登录后发表或查看评论

【AI大模型】LLaMA-Factory微调入门个人重制版

pythonhy的博客

09-04

1539

【AI大模型】LLaMA-Factory微调入门个人重制版

LLaMA-Factory训练DeepSeek大模型+本地部署

墨家巨子@俏如来

03-10

3087

前面我们介绍了基于硅基流动训练私有大模型《10分钟教你微调自己的私有大模型》，该平台有三个不好的点就是可选的模型有限，训练时间需要排队等待耗时长，另外还要给钱。今天我们换一个平台，使用：魔搭平台 + llamaFactory训练私有模型。平台会赠送服务器时长这样我们就可以不用花钱就可以训练自己的大模型了(学习使用)

本地离线模型搭建指南-LLaMA-Factory训练框架及工具

Master_Shifu_的博客

06-23

3725

搭建一个本地中文大语言模型（LLM）涉及多个关键步骤，从选择模型底座，到运行机器和框架，再到具体的架构实现和训练方式。以下是一个详细的指南，帮助你从零开始构建和运行一个中文大语言模型。本地离线模型搭建指南将按照以下四个部分展开。

本地部署llama-factory

A97139012的博客

01-15

475

本地部署llama-factory

【LLama-Factory】开源低代码大模型微调框架本地部署和使用保姆级教程！！！

weixin_43012017的博客

12-23

3776

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。不想通过GitHub跳转到文档，可以通过下面的链接直接访问LLama-Factory官方文档。

AI智能体研发之路-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

人工智能领域博客

05-14

1万+

本文先对LLaMA-Factory项目进行介绍，之后逐行详细介绍了该项目在国内网络环境下如何安装、部署，最后以Baichuan2-7B为例，通过讲解训练参数的方式详细介绍了基于LLaMA-Factory WebUI的大模型微调训练。篇幅有限，专栏内会持续更新，详细介绍大模型微调训练方法。如果觉得对你有帮助，期待您的关注，点赞、收藏或评论，您的支持是我持续码字的动力。

(LLaMa Factory)大模型训练方法--准备模型（Qwen2-0.5B）

weixin_63373973的博客

02-15

622

1、准备训练框架是一款开源低代码大模型微调框架，集成了业界最广泛使用的微调技术，支持通过Web UI界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架。

【提升模型效能】：五步提升LLaMA-Factory微调模型的准确率和效率

![【提升模型效能】：五步提升LLaMA-Factory微调模型的准确率和效率]... LLaMA-Factory微调模型概述 ## 1.1 LLaMA-Factory简介 LLaMA-Fact

【LLaMA-Factory入门秘籍】：零基础快速掌握多模态大语言模型微调

[【LLaMA-Factory入门秘籍】：零基础快速掌握多模态大语言模型微调](https://imagepphcloud.thepaper.cn/pph/image/289/325/270.jpg) # 1. 多模态大语言模型微调简介在这一章中，我们将探索多模态大语言模型微调的...

基于LLaMA-Factory框架的本地模型微调

Dr_Tang_的博客

02-26

595

1）查看本机电脑支持的最高CUDA版本，进入CMD命令行，执行命令，右上角为当前显卡最高支持CDUA版本。这里可能会出现一个问题，安装不到torch的问题，那就去安装你自己python对应的torch版本，3）格式转化，这边我用的是绝对路径，并且转化生成目录是当前目录，转化成一个GGUF文件。4）编写Modelfile文件，这个路径我这里用的也是绝对路径，是刚刚gguf那个文件。3）安装完成之后，查看是否安装成功，如下图所示，即为安装成功。9）开始训练，注意训练完毕之后的适配器输出位置，后面用得到。

LLaMA-Factory本地微调：入门级教程

热门推荐

失业求捞！

05-17

2万+

本文记录了从环境部署到微调模型、效果测试的全过程，以及遇到几个常见问题的解决办法，亲测可用（The installed version of bitsandbytes was compiled without GPU support. NotImplementedError: Architecture ‘LlamaForCausalLM’ not supported!

Llama3本地部署与高效微调入门

水工鸟的专栏

05-06

5848

为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，上下文窗口为8k。Meta表示，通过使用更高质量的训练数据和指令微调，Llama 3比前代Llama 2有了“显著提升”。未来，Meta将推出Llama 3的更大参数版本，其将拥有超过4000亿参数。

调研分析：LLama大模型

qq_28704101的博客

07-02

1361

随着技术的发展，新的模型不断涌现，推动了NLP领域的持续进步。LLama模型在大规模、多样化的语料库上进行了预训练，并采用了先进的Transformer架构和优化技术，如分布式训练和混合精度训练，显著提升了训练效率和效果。开源版本的发布吸引了全球研究者和开发者的关注，形成了一个活跃的社区，推动了LLama模型的持续改进和优化。综上所述，LLama模型的架构不仅在传统Transformer基础上进行了优化和创新，还通过多种技术手段提升了模型的性能和效率，使其在NLP领域具有广泛的应用前景和研究价值。

教程：利用LLaMA_Factory微调llama3:8b大模型

m0_60683691的博客

05-06

4516

在存放模型空白处右键，点击git bash here，下载llama3模型至本地由于文件较大，因此该过程比较久，保持下载窗口打开，知道出现下一命令行表示下载完成。

【LLaMA-Factory使用教程】大模型本地部署和微调

啥都想干&&啥都干不好的博客

01-23

433

大模型部署微调教程

【项目记录】LLaMA-Factory + ModelScope 指令监督微调

weixin_45724176的博客

07-24

1632

LLaMA-Factory是大模型微调框架，内部集成了多种微调方法，可以直接调用。

llama-factory如何部署大模型

03-29

<think>好的，用户想了解如何部署LLaMA-Factory的大模型。首先，我需要回忆一下LLaMA-Factory的相关文档和步骤。根据用户提供的引用内容，特别是引用[1]和[2]，已经提到了环境搭建和后续的模型部署部分。用户可能在完成环境搭建后，需要进一步部署模型，所以需要详细的步骤指导。首先，用户可能已经按照之前的教程安装了LLaMA-Factory，并激活了conda环境。接下来，部署模型可能需要下载预训练模型，配置参数，启动Web界面或API服务。需要确保用户知道如何正确下载模型，并放置到正确的目录下，比如可能放在项目的某个子目录中。同时，LLaMA-Factory可能提供了命令行工具或脚本用于启动服务，需要具体说明这些命令。另外，用户可能遇到模型文件下载的问题，比如从哪里获取Hugging Face上的模型，或者是否需要转换模型格式。需要指导用户使用git lfs或者huggingface-cli来下载大模型文件。此外，可能还需要修改配置文件，指定模型路径和其他参数，比如调整batch_size或者选择不同的模型类型。用户还可能关心如何测试部署后的模型，比如通过Web界面进行对话或者使用API调用。需要说明启动Web Demo的步骤，并给出访问的URL。此外，可能还需要提到多模型部署的情况，如何切换不同的模型，或者同时运行多个模型实例。需要检查是否有常见的错误，比如路径错误、依赖缺失或者版本不兼容。例如，确保所有必要的依赖包已经安装，特别是CUDA版本与PyTorch的兼容性。另外，模型文件可能很大，需要足够的磁盘空间，这也是需要注意的地方。最后，按照用户的要求，生成相关问题，帮助用户进一步了解微调、性能优化和应用场景。确保回答结构清晰，步骤详细，并且引用正确的参考资料，如引用[1]和[2]提到的内容。</think>以下为基于LLaMA-Factory的大模型部署分步指南，结合官方文档及实践总结： ### 一、环境检查 1. 已按教程创建conda环境并激活 ```bash conda activate llama_factory # 确保环境已激活[^1] ``` 2. 验证核心依赖版本 ```bash python -c "import torch; print(torch.__version__)" # 应≥2.0.0 ``` ### 二、模型准备 1. 下载HuggingFace格式模型（以Llama3-8B为例） ```bash huggingface-cli download meta-llama/Meta-Llama-3-8B --local-dir ./models/llama3-8b ``` 2. 配置模型路径（修改`LLaMA-Factory/models/model_info.json`） ```json { "llama3-8b": { "model_name_or_path": "./models/llama3-8b", "template": "llama3" } } ``` ### 三、启动服务 1. 启动Web Demo（可视化对话） ```bash CUDA_VISIBLE_DEVICES=0 python src/web_demo.py \ --model_name_or_path ./models/llama3-8b \ --template llama3 \ --infer_backend vllm # 使用vLLM加速推理 ``` 访问地址：`http://localhost:7860` 2. API服务部署（生产环境推荐） ```bash python -m llama_factory.serve.openai_api \ --model_name_or_path ./models/llama3-8b \ --api_host 0.0.0.0 \ --api_port 8000 ``` API端点：`http://localhost:8000/v1` ### 四、验证部署 1. 发送测试请求 ```python import openai client = openai.OpenAI(base_url="http://localhost:8000/v1") response = client.chat.completions.create( model="llama3-8b", messages=[{"role": "user", "content": "解释量子纠缠"}] ) print(response.choices[0].message.content) ``` ### 关键配置参数说明 | 参数 | 作用 | 推荐值 | |------|------|-------| | `--load_in_8bit` | 8位量化加载 | 显存<24G时启用 | | `--trust_remote_code` | 信任自定义代码 | True | | `--max_new_tokens` | 生成最大长度 | 512 | | `--temperature` | 生成温度 | 0.7-1.0 |