大模型 lora 训练后的权重合并

最新推荐文章于 2025-04-16 10:16:29 发布

TFATS

最新推荐文章于 2025-04-16 10:16:29 发布

阅读量493

点赞数 3

分类专栏： LLM 大模型文章标签：深度学习大模型 AIGC

本文链接：https://blog.csdn.net/TFATS/article/details/145425162

版权

LLM 大模型专栏收录该内容

7 篇文章

订阅专栏

本文将介绍如下内容：

一、Lora 合并的环境依赖
二、Lora 合并代码实现

一、Lora 合并的环境依赖

autoawq                           0.2.5
peft                              0.14.0
transformers                      4.46.3

二、Lora 合并代码实现

import torch
from peft import PeftModel
from transformers import AutoTokenizer, AutoModelForCausalLM, LlamaTokenizer
from transformers.generation.utils import GenerationConfig


def apply_lora(model_name_or_path, output_path, lora_path):
    print(f"Loading the base model from {model_name_or_path}")
    base_tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=False, trust_remote_code=True)
    # base = AutoModelForCausalLM.from_pretrained(model_name_or_path, torch_dtype=torch.bfloat16, trust_remote_code=True)
    base = AutoModelForCausalLM.from_pretrained(model_name_or_path, torch_dtype=torch.float32, trust_remote_code=True)

    print(f"Loading the LoRA adapter from {lora_path}")

    lora_model = PeftModel.from_pretrained(
        base,
        lora_path,
        torch_dtype=torch.float32,
    )

    print("Applying the LoRA")
    model = lora_model.merge_and_unload()

    print(f"Saving the target model to {output_path}")
    model.save_pretrained(output_path)
    base_tokenizer.save_pretrained(output_path)


if __name__ == "__main__":
    model_name_or_path = "/nasdata/zhanjie/models/Qwen2.5-32B-Instruct"
    output_path = "./output"
    lora_path = "/nasdata/zhanjie/models/qwen2_5-32B-lora-1-0-7"
    apply_lora(model_name_or_path, output_path, lora_path)
    print("Done")