LLama-factory大模型微调、ollama导入微调模型

郑琳潇

已于 2024-09-12 22:58:00 修改

阅读量718

点赞数 3

文章标签： llama

于 2024-09-11 19:23:51 首次发布

本文链接：https://blog.csdn.net/qq_45672807/article/details/141037422

版权

Llama-factory微调
模型的微调、推理和合并
微调

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml

推理

llamafactory-cli chat examples/inference/llama3_lora_sft.yaml

合并

llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml

合并后的模型格式为.safetensors，使用llama.cpp转换成gguf格式
进入llama.cpp中

python convert-hf-to-gguf.py [需要转换的模型文件夹位置]

得到gguf格式后导入ollama
1、编码Modelfile文件
1.1 创建一个文本文件，并改名为模型名，扩展名为Modelfile。例如，llama3-8b.modelfile
1.2 用记事本编辑器打开文件，并添加内容

FROM [你自己的模型地址

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

郑琳潇

关注关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

10、ollama启动LLama_Factory微调大模型（llama.cpp）

Andy_shenzl的博客

08-30

2957

在介绍了如何使用LLama_Factory微调大模型，并将微调后的模型文件合并导出，本节我们我们看下如何使用ollama进行调用。

LLaMA Factory单机微调的实战教程

最新发布

大话程序员

03-02

343

LLAMA-Factory,在经历了几个的坑之后，终于训练了完成了一次模型（调通了??不过下个文章才详细解析每个坑。

部署AI平台-Ollama

大AI时代，人性化的信息更加难得可贵

07-06

1478

介绍 llama：LLaMA(Large Language Model Meta AI)是由 Meta(原Facebook公司)发布的一系列大型语言模型。这些模型旨在处理和生成自然语言文本，能够执行多种任务，如文本摘要、翻译、问答、文本生成等。LLaMA 模型因其高效的性能和较小的模型尺寸而受到关注，这使得它们能够在资源有限的环境中运行，例如个人计算机或移动设备。 Ollama：是一个开源的大...

Ollama创建微调模型

qq_51279133的博客

06-08

3584

converted.bin为上一步转换模型得到的文件，quantized.bin为量化后的文件，q4_0为量化选项表示使用 4bit 量化（官方推荐），当然还有很多的量化选项，具体参见。这里只需要将 Modelfile 中 FROM 后面的文件路径替换为模型文件的目录即可，my-llama3是自定义的在 ollama 中的模型名称。，具体用哪个脚本进行转换我没有找到官方文档说明，建议一个不行就试另一个，在我使用过的模型中llama3 8b和 qwen 7b都是需要使用。

LLaMA-Factory+Ollama：本地部署大模型流程详解

m0_74748557的博客

10-13

6610

利用LLaMA-Factory和Ollama，在本地部署属于你自己的大模型。

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。

失业求捞！

05-17

1万+

本文记录了从环境部署到微调模型、效果测试的全过程，以及遇到几个常见问题的解决办法，亲测可用（The installed version of bitsandbytes was compiled without GPU support. NotImplementedError: Architecture ‘LlamaForCausalLM’ not supported!

用 Ollama 轻松玩转本地大模型

m0_54050778的博客

12-28

1万+

而作为价值约 8 美元/月的 Raycast AI 的平替，Raycast Ollama 实现了 Raycast AI 的绝大多数功能，且随着 Ollama 及开源模型的迭代，还将支持多模态等 Raycast AI 不支持的功能，可谓潜力无限。以 4-bit 量化为例，其将原本 FP16 精度的权重参数压缩为 4 位整数精度，使模型权重体积和推理所需显存均大幅减小，仅需 FP16 的 1/4 至 1/3，意味着约 4GB 显存即可启动 7B 模型的推理（当然实际显存需求会随着上下文内容叠加而不断增大）。

大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例

微学AI的博客

05-23

2412

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例, LLaMA-Factory是一个专门用于大语言模型微调的框架，它支持多种微调方法，如LoRA、QLoRA等，并提供了丰富的数据集和预训练模型，便于用户进行模型微调。通义千问Qwen1.5是阿里巴巴推出的一款大型语言模型，具有多语言处理能力和较强的生成能力。

llama-factory一个数据微调用例

07-26

"llama-factory"是一个数据微调的工具或平台，主要与LoRa（Long Range）技术相关，这是一项低功耗广域网通信技术，常用于物联网(IoT)应用。在给定的文件列表中，我们可以看到以下几个关键文件： 1. **dataset_info....

【06】LLaMA-Factory微调大模型——微调模型评估

H66778899的博客

07-19

8689

【06】LLaMA-Factory微调大模型——微调模型评估

Ollama安装使用与LLamaFactory微调模型（Windows）

JHZ056的博客

08-29

2648

Ollama 是一款开创性的人工智能（AI）和机器学习（ML）工具平台，它极大的简化了AI模型的开发和使用过程，Ollama出现的目的是为了解决AI模型的硬件配置和环境搭建的复杂问题：该工具的主要特点包括：（1）功能丰富，使用直观且高效。（2）对用户比较友好，上手无门槛。（3）推动AI普及，扩展AI能力。此外Ollama还会存在一系列的关键优势，它能自动识别并充分利用Windows系统中最优的硬件资源，可以实现针对性能优化，从而确保AI模型更加高效地运行；

一些Llama3微调工具以及如何在Ollama中运行

xiangxueerfei的博客

05-30

2841

Llama3是Meta提供的一个开源大模型，包含8B和 70B两种参数规模，涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间，并且在许多标准测试中展示了其卓越的性能。特别是Llama3 8B，其具备小尺寸和高质量的输出使其成为边缘设备或者移动设备上实现LLM的完美选择。但是Llama3也还有许多缺陷，因此，在场景应用中，有时候还需要对其进行微调，以提升中文能力、场景应用的专业度等。目前有许多团队在做微调工具，他们的贡献提高了我们的效率、减少失误。比较优秀的例如：MLX-LMPyReftlitgpt

Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型

03-01

1万+

Ollama是一个开源的大型语言模型服务工具，它帮助用户快速在本地运行大模型，通过简单的安装指令，可以让用户执行一条命令就在本地运行开源大型语言模型。本文旨在简易教会读者如何下载安装配环境以及使用Ollama，本地体验到大模型的快速便捷。

通过LlaMA-Factory导出的模型部署到Ollama

qq_35175478的博客

01-09

980

仓库地址：https://github.com/ggerganov/llama.cpp。LlaMA-Factory导出的模型转换格式。创建ModelFile文件。

使用LLaMA-Factory训练LLM大模型并用ollama调用

huang9604的博客

11-05

1336

使用LLaMA-Factory训练LLM大模型并用ollama调用

使用LLaMA-Factory训练LLM大模型并用ollama调用，一文教会你！！！

bugyinyin的博客

10-26

2421

需要Nvidia显卡，至少8G显存，且专用显存与共享显存之和大于20G 建议将非安装版的环境文件都放到非系统盘，方便重装或移植以Windows11为例，非安装环境文件都放在 E 盘下

llama-factory大模型微调

02-09

### LLaMA-Factory 大模型微调方法教程 #### 创建并激活虚拟环境在开始之前，确保已经完成基础环境配置。接着需要创建一个新的Python虚拟环境来管理依赖项： ```bash python3 -m venv llama-env source llama-env...