大模型18：微调大模型方法PEFT(LoRA等) — 训练 “ChatGLM2“ 项目

bluewelkin

于 2024-08-22 12:23:57 发布

阅读量380

点赞数 3

文章标签：大模型

本文链接：https://blog.csdn.net/bluewelkin/article/details/141424585

版权

微调大模型的方法之一是PEFT（Parameter-Efficient Fine-Tuning），其中包括LoRA（Low-Rank Adaptation）等技术。PEFT方法能够在不显著增加计算资源消耗的情况下，微调大模型，从而适应特定任务。这种方法特别适用于像“ChatGLM2”这样的预训练大模型。

什么是PEFT (Parameter-Efficient Fine-Tuning)?

PEFT是一种优化微调大模型的技术，目标是在减少训练参数量的同时仍然能够取得良好的微调效果。PEFT的几个常见方法包括：

LoRA (Low-Rank Adaptation)：通过将模型权重矩阵进行低秩分解，只微调低秩矩阵，从而减少计算量。
Adapter：引入额外的小规模网络层（适配器层），只微调这些层，保持原模型的主要参数不变。
Prefix-Tuning：在模型的输入序列前添加可学习的前缀向量，并仅微调这些前缀。

使用PEFT（如LoRA）微调“ChatGLM2”的步骤

以下是使用LoRA对“ChatGLM2”进行微调的基本步骤：

1. 准备环境和依赖

首先，你需要安装必要的库。假设你使用的是Python环境，安装相关库的命令如下：
```
pip install transformers peft loralib
```

2. 加载预训练模型 ChatGLM2

使用Hugging Face的Transformers库加载“ChatGLM2”模型。

from transformers import AutoModel, AutoTokenizer

model_name = "THUDM/chatglm2-6b"
model = AutoModel.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

3. 配置LoRA

设置LoRA的配置，指定微调的低秩矩阵

from peft import LoraConfig, get_peft_model

lora_config = LoraConfig(
    r=8,  # 低秩矩阵的秩
    lora_alpha=16,  # LoRA特定的放大系数
    target_modules=["q_proj", "v_proj"],  # 指定微调的模块
    lora_dropout=0.05,  # dropout比例
)

model = get_peft_model(model, lora_config)

4. 准备数据

加载并预处理你的训练数据。这部分因任务不同而异。以下是一个简单的示例：

from torch.utils.data import DataLoader
from transformers import DataCollatorWithPadding

# 假设你有一个dataset对象，包含文本数据
data_collator = DataCollatorWithPadding(tokenizer)
train_dataloader = DataLoader(dataset, batch_size=8, collate_fn=data_collator)

5. 训练模型

使用标准的训练循环进行模型微调。你可以使用优化器如AdamW。

from transformers import AdamW

optimizer = AdamW(model.parameters(), lr=1e-4)

for epoch in range(num_epochs):
    model.train()
    for batch in train_dataloader:
        outputs = model(**batch)
        loss = outputs.loss
        loss.backward()
        optimizer.step()
        optimizer.zero_grad()