Qwen模型LoRA微调后的两种启动方式

金桃不烦恼

已于 2024-05-18 17:07:15 修改

阅读量2.1k

点赞数 3

分类专栏：深度学习-大模型文章标签：深度学习自然语言处理人工智能

于 2024-05-18 17:03:29 首次发布

本文链接：https://blog.csdn.net/weixin_42118737/article/details/139027839

版权

本文记录了在使用LoRA微调后的Qwen模型时的两种启动方式，一种是原始模型+LoRA模型，一种是将两个模型合并保存后再调用的方式。

LoRA模型的启动方式

LoRA模型可以通过peft包中的AutoPeftModelForCausalLM进行加载：

from peft import AutoPeftModelForCausalLM

# 设置LoRA微调后的模型存储路径（checkpoint）
model = AutoPeftModelForCausalLM.from_pretrained("/home/<用户名>/nlp/Qwen/finetune/output_qwen_medical/checkpoint-1000/", device_map='auto',trust_remote_code=True).eval()

LoRA模型加载完毕还是需要transformers里面的AutoTokenizer：

from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("/home/<用户名>/nlp/Qwen/model/qwen/Qwen-1_8B-Chat", trust_remote_code=True)

然后再调model的chat方法即可：

# 第一轮对话
response, history = model.chat(tokenizer, "....", history =None)
print(response)

以合并LoRA模型与原始模型的参数方式加载

保存模型参数：

# 可以将LoRA参数与原始参数

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

金桃不烦恼

关注关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

开源模型应用落地-Qwen2-7B-Instruct与vllm-单机多卡-RTX 4090双卡（十一）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-07

3万+

4090单机双卡部署vllm，并集成qwen2-7b-instruct

开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机单卡-V100（十三）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-30

5271

使用ms-swift合并微调后的模型权重

参与评论您还未登录，请先登录后发表或查看评论

LoRA模型微调过程记录

最新发布

一千零一夜的博客

03-03

951

LoRA算法是通过低秩矩阵调整原始模型的权重，并没有修改权重本身，所以需要将LoRA权重合并到原始权重，生成一个新的完整权重。先点击卸载模型，卸载deepseek-r1-1.5b-distill模型，再加载微调后的模型。机器自带了conda，这些修改conda的配置，将虚拟环境配置在数据盘，这样关闭机器后，此虚拟环境不会清空，且此机器资源不足时，可以将此虚拟环境克隆到另一个空闲机器上。注意关机后，可以此机器后会被其他人征用，再次开机需等待他的释放。这里的按照量计费，是开机使用则开始计费，关机这不计费。

(附数据集)基于lora参数微调Qwen1.8chat模型的实战教程

小知的博客

03-16

4401

与全参数微调不同，LoRA和Q-LoRA的训练只需存储adapter部分的参数。使用LoRA训练后的模型，可以选择先合并并存储模型（LoRA支持合并，Q-LoRA不支持），再用常规方式读取你的新模型。一般会缓存到你的C盘或用户空间，所以要根据自己情况查看模型。也可以通过下面日志查看模型所在位置，如。使用微调后且合并的模型进行本地部署。阿里魔搭社区notebook的。觉得不错，点个star噢。里：下载模型会缓存在。克隆Qwen项目，调用。文件进行配置与微调。

Qwen 微调LoRA之后合并模型，使用 webui 测试

TuringEvo专栏

06-01

892

【代码】Qwen 微调LoRA之后合并模型，使用 webui 测试。

阿里云大模型Qwen系列输入参数说明

大F子的智能小课

05-21

6863

当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，默认每次输出为当前生成的整个序列，最后一次输出为最终全部生成结果，可以通过设置参数incremental_output为False改变输出模式为非增量输出。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为[108386,104307]，则模型将要生成“你好”或者“天气”时停止。

【大模型】部署lora微调后的LLM（以百川为例）

己亥孟陬

04-09

3889

首先，大模型是补全模型，也就是说，我们输入一句话，模型接着这句话往下续写，补全后文。我们需要一个特殊的prompt，使得模型可以意识到，它续写的时候需要按照对话这种情境来续写。不同的模型有不同的prompt，真正的问题是需要包裹在prompt里面的。当我们需要使用其他加速框架部署大模型时，需要自己完成这一步：要么在传入问题时直接传prompt格式的问题，或者框架有模板接口可以按照自定义模板在后台自动化完成这种格式转化。如果想要多人同时使用大模型，那么需要使用专门的大模型推理加速框架，比如vllm，tgi。

开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡（六）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-16

2万+

使用LLaMA-Factory合并微调后的模型权重

多模态大模型微调-基于Lora对Qwen-VL多模态大模型进行微调-附项目源码+流程教程-优质项目实战.zip

10-16

Qwen-VL是一个具有代表性的多模态大模型，它融合了视觉和语言两种模态的数据，能够实现对图像和文本数据的理解和处理。在实际应用中，Qwen-VL模型通常被用于图像标注、图像检索、视觉问答等场景。通过对Qwen-VL模型...

开源模型应用落地-Qwen2-7B-Instruct-Lora与vllm-单机多卡-RTX 4090双卡（十五）

热门推荐

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-12

3万+

4090单机双卡部署vllm，并集成qwen2-7b-instruct和Lora权重

【通义千问】大模型Qwen GitHub开源工程学习笔记（5）-- 模型的微调【全参数微调】【LoRA方法】【Q-LoRA方法】

weixin_46481662的博客

01-07

2832

注意，如果你使用预训练模型进行LoRA微调，而非chat模型，模型的embedding和输出层的参数将被设为可训练的参数。秩分解矩阵可以看作是一种特殊的调料，它可以改变模型的行为，使模型更好地适应新的任务，但并不会改变原有的食材（即预训练模型的权重）。相比之下，LoRA将预训练模型的权重冻结，并在转换器架构的每一层注入可训练的秩分解矩阵。这意味着在这种方法中，原始的预训练权重 W 是固定的，不会在后续的训练过程中进行更新，而是只对 A 和 B 进行训练。在全参数微调中，所有的模型参数都会被重新训练。

[大模型]Qwen1.5-7B-chat Lora 微调

FL1623863129的博客

04-11

3662

LoraConfig这个类中可以设置很多参数，但主要的参数没多少，简单讲一讲，感兴趣的同学可以直接看源码。task_type：模型类型：需要训练的模型层的名字，主要就是attention部分的层，不同的模型对应的层的名字不同，可以传入数组，也可以字符串，也可以正则表达式。rlora的秩，具体可以看Lora原理lora_alphaLora alaph，具体作用参见Lora原理Lora的缩放是啥嘞？当然不是r（秩），这个缩放就是, 在这个LoraConfig中缩放就是4倍。

lora微调大模型Qwen2.5_32B

lft_happiness的博客

11-26

3268

lora微调大模型Qwen2.5_32B，包括数据准备，设置参数，模型微调具体步骤，模型推理和模型合并的具体实践过程

lora微调Qwen模型全流程

qq_62231627的博客

07-28

3719

LoRA（Low-Rank Adaptation）是一种用于大模型高效微调的方法。通过对模型参数进行低秩分解和特定层的微调，LoRA 能在保持模型性能的前提下显著减少训练所需的参数量和计算资源。接下来是对 LoRA 微调 Qwen 模型的完整技术流程概述：模型和分词器加载首先，从预训练模型库中加载预训练的 Qwen 模型和分词器。预训练模型是大规模语料上训练的通用语言模型，能够为特定任务提供强大的语言理解和生成能力。配置 LoRA。

开源模型应用落地-qwen模型小试-调用Lora模型-进阶篇（七）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

03-14

2920

调用微调后的qwen-7b-chat模型

基于LoRA微调多模态大模型

2301_82275412的博客

05-23

1505

BLIP-2通过利用预训练的视觉模型和语言模型来提升多模态效果和降低训练成本，预训练的视觉模型能够提供高质量的视觉表征，预训练的语言模型则提供了强大的语言生成能力。如下图所示，由一个预训练的，一个预训练的和一个可学习的Q-Former组成。image.png：负责从输入图片中提取视觉特征。：负责文本生成。Q-Former：负责弥合视觉和语言两种模态的差距，由和两个子模块构成，它们共享相同自注意力层，如下图所示。

Qwen-7B私有化部署及LoRA微调

cici_v_的专栏

01-25

4216

Qwen7B大模型部署及微调

Qwen2大模型微调入门实战（完整代码）

2401_84494441的博客

07-02

1226

Qwen2]是通义千问团队的开源大语言模型，由阿里云通义实验室研发。以Qwen2作为基座大模型，通过指令微调的方式实现高准确率的文本分类，是学习的入门任务。指令微调是一种通过在由（指令，输出）对组成的数据集上进一步训练LLMs的过程。其中，指令代表模型的人类指令，输出代表遵循指令的期望输出。这个过程有助于弥合LLMs的下一个词预测目标与用户让LLMs遵循人类指令的目标之间的差距。在这个任务中我们会使用模型在数据集上进行指令微调任务，同时使用SwanLab进行监控和可视化。

Qwen-VL图文多模态大模型LoRA微调指南

AI相关从业分享

06-17

4538

Qwen-VL 是阿里云研发的大规模视觉语言模型（Large Vision Language Model, LVLM）。Qwen-VL 可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。Qwen-VL 系列模型的特点包括：多语言对话模型：天然支持英文、中文等多语言对话，端到端支持图片里中英双语的长文本识别；多图交错对话：支持多图输入和比较，指定图片问答，多图文学创作等；开放域目标定位：通过中文开放域语言表达进行检测框标注；本文基于此进行微调。

qwen2.5lora微调

12-30

### 使用LoRA技术对Qwen 2.5模型进行微调对于希望利用低秩适应（Low-Rank Adaptation, LoRA）方法来优化Qwen 2.5模型训练过程的情况，可以采取如下方式实现高效而节省资源的微调操作[^1]。 #### 准备工作环境确保安装了必要的依赖库以及配置好了适合于运行深度学习任务的工作站或云端实例。考虑到Qwen系列是由阿里云开发的语言模型，在准备阶段可能还需要获取相应的API访问权限或是下载预训练权重文件。 #### 加载基础模型与设置超参数加载未经修改的基础版Qwen 2.5作为起点，并定义用于指导后续调整工作的几个重要变量——比如LoRA中的`r`(即矩阵分解后的维度大小)和`lora_alpha`等控制因子。这些数值的选择会直接影响到最终输出的质量及性能表现，所以建议依据具体应用场景和个人偏好做出适当设定。 ```python from transformers import AutoModelForCausalLM, LoraConfig model_name_or_path = "Qwen/Qwen-7B" peft_config = LoraConfig( r=8, lora_alpha=32, target_modules=["q_proj", "v_proj"], bias="none", ) base_model = AutoModelForCausalLM.from_pretrained(model_name_or_path) ``` #### 数据集处理针对特定领域定制化需求收集并整理好高质量标注样本集合；这里提到的例子是以法律咨询类问答为例进行了针对性增强[^2]。注意要遵循数据清洗、分词编码等一系列标准流程使原始文本适配输入格式要求。 #### 构建训练循环编写脚本完成整个迭代更新周期内的各项事务安排，像批次划分、梯度累积策略制定直至损失函数计算都属于此环节内不可或缺的部分。期间务必密切监控GPU内存消耗状况以免超出硬件承载极限引发异常中断现象发生[^3]。 ```bash # 假设使用的是PyTorch Lightning框架下的Trainer对象来进行分布式加速运算 trainer.fit(model=model, dataloaders=train_dataloader) ``` #### 调整评估指标体系最后一步则是确立一套科学合理的评测准则用来衡量经过改造之后的新版本相较于原生形态究竟取得了哪些进步之处。这不仅有助于直观反映改进成果更有利于持续跟踪观察长期发展趋势走向何方。