Peft库实战（二）：Lora微调mt5-xxl【Seq2Seq：翻译、自动摘要、信息抽取】

u013250861

已于 2023-07-06 01:48:04 修改

阅读量513

点赞数

分类专栏： # LLM/预训练&SFT 文章标签： peft mt5

于 2023-07-02 14:24:28 首次发布

本文链接：https://blog.csdn.net/u013250861/article/details/131500401

版权

LLM/预训练&SFT 专栏收录该内容

84 篇文章 62 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

一、Lora微调mt5-xxl

GPU要求：至少 A100-SXM4-80GB * 2

batch_size：A100-SXM4-80GB * 2情况下最大 16

备注：mt5-xxl全参数微调，batch_size=2时，A100-SXM4-80GB至少需要5张

run_finetune_lora.py

import logging
import os
import sys
import numpy as np
from datasets import Dataset
from peft import PeftModel
from peft import LoraModel, LoraConfig, get_peft_model
import random
import torch
import json
import transformers
from transformers import AutoConfig, AutoTokenizer, AutoModelForSeq2SeqLM, DataCollatorForSeq2Seq, HfArgumentParser, Seq2SeqTrainer, Seq2SeqTrainingArguments
from transformers.trainer_utils import get_last_checkpoint, is_main_process
from arguments import ModelArguments, DataTrainingArguments
from utils import get_extract_metrics_f1


os.environ["WANDB_DISABLED"] = "true"
logger = logging.getLogger("__main__&#

了解本专栏