基于qlora训练后的大模型和原模型合并

最新推荐文章于 2024-05-31 10:37:00 发布

weixin_41687218

最新推荐文章于 2024-05-31 10:37:00 发布

阅读量1.1k

点赞数

文章标签：深度学习人工智能 pytorch 机器学习

本文链接：https://blog.csdn.net/weixin_41687218/article/details/134656302

版权

合并过程

import os

os.environ["CUDA_VISIBLE_DEVICES"] = "0,1,2,3"

from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

"""
将lora权重合并到大模型中
"""

def merge_lora_to_LLM():
    model_name_or_path = "your_LLM_model_path"
    adapter_name_or_path = "your_lora_model_path"
    save_path = "save_model_path"
    
    tokenizer = AutoTokenizer.from_pretrained(
        model_name_or_path,
        trust_remote_code=True
    )
    model = AutoModelForCausalLM.from_pretrained(
        model_name_or_path,
        trust_remote_code=True,
        low_cpu_mem_usage=True,
        torch_dtype=torch.float16,
        device_map="auto"
    )
    model = PeftModel.from_pretrained(model, adapter_name_or_path)
    model = model.merge_and_unload()

    tokenizer.save_pretrained(save_path)
    model.save_pretrained(save_path)

if __name__ == "__main__":
    merge_lora_to_LLM()