PyTorch实战：使用transformers的Trainer微调预训练模型

最新推荐文章于 2025-03-09 20:28:18 发布

fengbeely

最新推荐文章于 2025-03-09 20:28:18 发布

阅读量647

点赞数 4

文章标签： pytorch 机器学习深度学习

本文链接：https://blog.csdn.net/fengbeely/article/details/140407030

版权

背景

transformers提供了非常便捷的api来进行大模型的微调，下面就讲一讲利用Trainer来微调大模型的步骤

第一步：加载预训练的大模型

from transformers import AutoModelForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased")

第二步：设置训练超参

from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="path/to/save/folder/",
    learning_rate=2e-5,
    per_device_train_batch_size=8,
    per_device_eval_batch_size=8,
    num_train_epochs=2,
)

比如这个里面设置了epoch等于2

第三步：获取分词器tokenizer

from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")

第四步：加载数据集

from datasets import load_dataset

dataset = load_dataset("rotten_tomatoes")  # doctest: +IGNORE_RESULT
<

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

fengbeely

关注关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【Transformer-Hugging Face手册 07/10】微调预训练模型

gongdiwudu的专栏

02-07

3296

使用预训练模型有显着的好处。它可以降低计算成本和碳足迹，并允许您使用最先进的模型，而无需从头开始训练。 🤗 Transformers 提供了针对各种任务的数千个预训练模型的访问权限。当您使用预训练模型时，您可以在特定于您的任务的数据集上对其进行训练。这被称为微调，是一种非常强大的训练技术。

使用 Hugging Face 的 Transformers 库加载预训练模型遇到的问题

suiusoar

07-09

1120

使用 Hugging Face 的 Transformers 库加载预训练模型时，模型的某些参数与预训练模型检查点（checkpoint）中的参数形状不匹配

参与评论您还未登录，请先登录后发表或查看评论

大模型底层 transformers源码解析之trainer.py

强化学习曾小健

04-17

3895

我会根据你提供的trainer.py源代码,用python的Graph包画出流程图,并着重介绍train()方法。- 将 inputs 通过 self._prepare_inputs 方法处理后传给 self.training_step。- 调用 optimizer.step() 和 lr_scheduler.step() 进行参数更新。计算总共需要训练的步数 max_steps 和 num_train_epochs。- 每 args.logging_steps 个步骤打印训练日志。

在PyTorch里面利用transformers的Trainer微调预训练大模型

duzm200542901104的专栏

09-20

1677

利用Trainer提供的api，只需要简简单单的九步，十几行代码就能进行大模型的微调，你要不要动手试一试？

【Hugging Face】transformers 库中的 Trainer：简化 PyTorch 模型的训练、评估和推理

彬彬侠的博客

03-09

663

Trainer是Hugging Face transformers库提供的一个高级API，用于简化PyTorch模型的训练、评估和推理，适用于文本分类、翻译、摘要、问答等NLP任务。它支持：自动批量训练，多GPU训练，自动梯度累积，混合精度训练，模型评估，与datasets兼容的数据加载只需几行代码即可完成数据加载、训练、评估、推理。支持多GPU、混合精度训练，优化计算资源使用。适用于NLP任务的Transformer微调，如果需要更精细的控制，可使用PyTorch原生训练循环。

9个技巧让你的PyTorch模型训练变得飞快！

AI公园

11-15

1951

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：William Falcon编译：ronghuaiyang导读一个step by step的指南，非常的实用。不要让你的神...

【Transformers基础入门篇7】基础组件之Trainer

hjxu2016的博客

09-25

1246

Trainer是库中提供的训练的函数，内部封装了完整的训练、评估逻辑，并集成了多种的后端，如等，搭配对训练过程中的各项参数进行配置，可以方便快捷地启动模型单机/分布式训练使用Trainer进行模型训练对模型的输入输出是有限制的，要求模型返回元组或者的子类如果输入中提供了labels，模型要能返回loss结果，如果是元组，要求loss为元组中的第一个值。

【AI大模型】Transformers大模型库（十一）：Trainer训练类

人工智能领域博客

06-20

3119

在Hugging Face的Transformers库中，Trainer类是一个强大的工具，用于训练和评估机器学习模型。它简化了数据加载、模型训练、评估和日志记录的过程。

Hugging Face实战（NLP实战/Transformer实战/预训练模型/模型微调/PyTorch版本）下篇之模型训练

07-12

在Hugging Face中，可以使用`transformers.Trainer`类进行模型的微调，它提供了自动处理数据加载、优化器选择、训练循环等功能。四、分词器的使用在NLP任务中，数据预处理是关键步骤，其中分词是将文本拆分为...

【迁移学习应用】：PyTorch NLP中的预训练模型使用指南

在特定任务上，通过继续训练或微调预训练模型，可以取得比从头开始训练更好的效果和更高的效率。 ## 1.3 选择合适的预训练模型不同类型的预训练模型适用于不同的任务。例如，在NLP领域，BERT、GPT和XLNet等模型是...

pytorch-large-model-support:PyTorch中的大型模型支持

04-14

<征求反馈> PyTorch LMS用户最近打开了一个问题，要求社区支持以将LMS集成到PyTorch的正式版本中：这是一个很好的机会，可以收集所有用户的推荐书和成功案例，以证明LMS在公共场所的价值。请随时在对话中分享您的支持和任何想法。 </要求反馈> PyTorch大型模型支持 PyTorch大型模型支持（LMS）是（WML CE）提供的PyTorch的功能，它允许成功训练深度学习模型，否则将耗尽GPU内存并因“内存不足”而中止错误。 LMS通过在不需要张量时临时将张量交换到主机内存来管理GPU内存的超额订购。 深度学习模型的一个或多个元素可能导致GPU内存耗尽。这些包括：模型深度和复杂度基本数据大小（例如，高分辨率图像）批量大小传统上，解决此问题的方法是修改模型，直到模型适合GPU内存为止。但是，这种方法会对准确性产生负面影响，尤其是在通过降低数据保真

pytorch-trainer:PyTorch的培训师像Chainer的培训师

04-24

PyTorch的培训师像Chainer的培训师我们可以在PyTorch上使用Trainer，Evaluator，Extension和Reporter。安装 pip install git+https://github.com/Hiroshiba/pytorch-trainer 例子请参阅是从modifyed 。 # Train with Trainer PYTHONPATH= ' . ' python examples/train_mnist.py \ --device cuda \ --autoload \ --epoch 5 LogReport扩展的日志： epoch main/loss validation/main/loss main/accuracy validation/main/accuracy elapsed_time 0

Pytorch-Lightning中的训练器--Trainer

kuxingseng123的博客

01-30

9658

慢慢的将其常用库都给其搞明白，明天开始马慢慢的将Lighting代码框架全部搞定。

Transformers实战——Trainer和文本分类

厚积而薄发

11-16

2045

【代码】Transformers实战——Trainer和文本分类。

9个技巧让你的 PyTorch 模型训练飞快！

Python数据挖掘

12-30

2714

也许你仍然在使用32位精度进行计算，或者甚至只是在单个GPU上进行训练。然而，随着科技的进步，我们已经有了更好的选择。使用更高精度的计算，如16位浮点数或混合精度，可以提高训练速度并减少内存消耗。同时，利用多个GPU进行并行训练，可以大大加快训练过程。我在这里总结了提升Pytorch模型训练速度的9个技巧，与大家分享，

使用PyTorch开发AI大模型

AI天才研究院

01-21

2032

1.背景介绍在过去的几年里，人工智能(AI)技术的发展迅速，尤其是深度学习(Deep Learning)技术，它已经成为解决许多复杂问题的关键技术之一。PyTorch是一个流行的深度学习框架，它提供了易于使用的API，使得开发人员可以快速地构建和训练AI大模型。在本文中，我们将讨论如何使用PyTorch开发AI大模型，包括背景介绍、核心概念与联系、核心算法原理和具体操作步骤、数学模型公式详细讲...

Trainer：PyTorch中的通用模型训练框架

gitblog_00080的博客

06-09

650

Trainer：PyTorch中的通用模型训练框架去发现同类优质开源项目:https://gitcode.com/ Trainer是一个基于PyTorch的模型训练库，它提供了一个简洁易懂的代码结构，使您能快速高效地实现和优化您的深度学习模型。项目介绍这个开源项目旨在简化和标准化模型的训练过程，无论您是初级开发者还是经验丰富的数据科学家。通过Trainer，您可以轻松地定义和训练模型，同时...

pytorch-模型训练

wyw0000的博客

06-27

1744

pytorch 模型训练

使用 PyTorch 与 Hugging Face PEFT 库进行 QLoRA 微调，结合 Transformers Trainer 实现高效训练 . 解释一下以上信息

最新发布

03-11

<think>好的，我现在要解释如何使用PyTorch和Hugging Face的PEFT库进行QLoRA微调，并结合Transformers的Trainer来实现高效训练。首先，我需要回忆一下QLoRA的基本概念，可能和LoRA有关，对吧？LoRA是低秩适应，用于高效微调大模型。那QLoRA可能是量化版的LoRA，结合了量化技术来减少内存使用。然后，PEFT库是Hugging Face的一个参数高效微调库，支持多种方法，包括LoRA。那QLoRA应该也是PEFT支持的一种方法。需要确认一下PEFT是否支持QLoRA，可能需要查看文档。不过用户已经提到要结合PEFT库，所以应该支持。接下来是Transformers Trainer，这个类提供了训练模型的便捷方式，不需要自己写训练循环。结合Trainer和PEFT的QLoRA，应该是在创建模型的时候应用PEFT的配置，然后传递给Trainer进行训练。接下来需要分步骤解释整个过程。首先，安装必要的库，如torch、transformers、peft。然后，加载预训练模型，并应用QLoRA配置，可能通过get_peft_model函数。然后设置训练参数，使用Trainer类，传入模型、数据集、训练参数等。需要提到QLoRA的优势，比如通过量化降低显存占用，同时保持低秩适配，这样可以在较小的GPU上微调大模型。可能还需要说明量化是如何应用的，比如4-bit量化，以及LoRA的秩和alpha参数的选择。可能还需要提到数据集的处理，使用datasets库加载数据，并进行预处理，比如tokenization。然后使用Trainer的train方法进行训练。需要注意的细节包括：模型加载时可能需要使用BitsAndBytes库进行4-bit量化，因为Hugging Face的transformers已经集成了这个功能。所以在加载模型时，要指定load_in_4bit=True，并结合bnb的配置参数。然后，PEFT的配置参数，比如LoRA的r、lora_alpha、target_modules等。需要确定哪些模块需要添加LoRA适配器，通常是注意力层的q、v矩阵。训练参数方面，使用TrainingArguments设置输出目录、学习率、批次大小等，然后传递给Trainer。最后，训练完成后保存适配器权重，而不是整个模型，这样可以节省空间。加载的时候，需要先加载原模型，再加载适配器。可能需要考虑常见问题，比如显存不足，这时候QLoRA的优势就体现出来了。或者训练过程中的稳定性，比如梯度裁剪、优化器选择等。总结步骤应该是：安装库，加载并量化模型，应用PEFT配置，准备数据，设置训练参数，训练，保存。每个步骤需要简要说明，并强调QLoRA如何提高效率，减少资源消耗。还要确保使用正确的中文术语，比如“量化”、“低秩适配器”、“参数高效微调”等。需要检查是否有遗漏的关键点，比如模型保存和加载的方式，或者评估方法，但用户主要关注训练实现，可能不需要深入评估部分。可能还需要给出一个简单的代码示例框架，帮助用户理解结构，比如如何用代码实现各个步骤。但用户的问题主要是解释，所以代码可以简略，用文字描述步骤。最后，要确保回答结构清晰，分点或分步骤，让用户容易理解。同时保证技术细节正确，比如QLoRA确实结合了4-bit量化和LoRA，PEFT库的支持情况等。</think>以下是对使用 **PyTorch + Hugging Face PEFT (QLoRA) + Transformers Trainer** 进行高效模型微调的技术解析，分步说明其核心原理与实现流程： --- ### 一、核心概念 1. **QLoRA (Quantized Low-Rank Adaptation)** - **量化 (Quantization)**: 将模型权重从 FP32/FP16 压缩为 4-bit 精度，大幅降低显存占用。 - **低秩适配 (LoRA)**: 冻结原模型参数，仅训练低秩分解的适配器（Adapter），减少可训练参数量（通常 <1%）。 - **结合优势**: QLoRA 通过 4-bit 量化 + LoRA 微调，实现在单卡（如 24GB GPU）上微调超大规模模型（如 70B 参数）。 2. **关键技术组件** - **PyTorch**: 基础深度学习框架。 - **Hugging Face Transformers**: 提供预训练模型与 `Trainer` 类（简化训练流程）。 - **PEFT (Parameter-Efficient Fine-Tuning)**: 实现参数高效微调方法（如 LoRA、QLoRA）。 --- ### 二、实现步骤 #### 1. 环境准备安装关键库： ```bash pip install torch transformers peft accelerate bitsandbytes datasets ``` #### 2. 加载模型与量化配置使用 `BitsAndBytes` 进行 4-bit 量化： ```python from transformers import AutoModelForCausalLM, BitsAndBytesConfig bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.bfloat16, bnb_4bit_use_double_quant=True ) model = AutoModelForCausalLM.from_pretrained( "meta-llama/Llama-2-7b-hf", quantization_config=bnb_config, device_map="auto" ) ``` #### 3. 应用 QLoRA 适配器通过 PEFT 添加低秩适配层： ```python from peft import LoraConfig, get_peft_model lora_config = LoraConfig( r=8, # 低秩矩阵的秩 lora_alpha=32, # 缩放因子 target_modules=["q_proj", "v_proj"], # 目标模块（注意力层的 Q/V 矩阵） lora_dropout=0.05, task_type="CAUSAL_LM" ) model = get_peft_model(model, lora_config) model.print_trainable_parameters() # 输出可训练参数量（通常 <1%） ``` #### 4. 配置训练参数使用 `TrainingArguments` 定义训练超参数： ```python from transformers import TrainingArguments training_args = TrainingArguments( output_dir="./results", per_device_train_batch_size=4, gradient_accumulation_steps=4, learning_rate=2e-5, num_train_epochs=3, fp16=True, # 混合精度训练 logging_steps=10, save_steps=100, optim="paged_adamw_8bit" # 优化器适配量化 ) ``` #### 5. 准备数据集使用 `datasets` 库加载数据并预处理： ```python from datasets import load_dataset dataset = load_dataset("json", data_files="data.jsonl") tokenized_data = dataset.map( lambda x: tokenizer(x["text"], truncation=True, max_length=512), batched=True ) ``` #### 6. 启动训练通过 `Trainer` 封装训练流程： ```python from transformers import Trainer trainer = Trainer( model=model, args=training_args, train_dataset=tokenized_data["train"], data_collator=lambda data: {"input_ids": torch.stack([d["input_ids"] for d in data])} ) trainer.train() ``` #### 7. 保存与加载适配器仅保存轻量级适配器权重： ```python model.save_pretrained("adapter_weights") # 保存适配器 # 加载时先加载原模型，再加载适配器 model = AutoModelForCausalLM.from_pretrained(...) model = PeftModel.from_pretrained(model, "adapter_weights") ``` --- ### 三、关键优势 1. **显存高效** - 4-bit 量化减少约 70% 显存占用。 - 梯度检查点（Gradient Checkpointing）进一步优化显存。 2. **参数高效** - 仅训练适配器参数（如 7B 模型仅需 0.03B 可训练参数）。 3. **无缝集成** - 与 Hugging Face 生态（如 `Trainer`、`datasets`）深度兼容。 --- ### 四、典型应用场景 - 在有限算力下微调大语言模型（如 LLaMA、Falcon）。 - 快速迭代多任务适配（每个任务保存独立适配器）。通过 QLoRA + Transformers Trainer，开发者能以极低资源成本实现大模型定制化，平衡效率与性能。