如何使用hugging face transformers库微调预训练模型【精炼要点】

最新推荐文章于 2025-04-08 11:01:10 发布

MJy65535

最新推荐文章于 2025-04-08 11:01:10 发布

阅读量1.2k

点赞数 6

分类专栏： LLM 文章标签：人工智能深度学习

本文链接：https://blog.csdn.net/MJy65535/article/details/140120368

版权

以下内容是对hugging face官方NLP教程“微调一个预训练模型”章节的精炼总结。
详细内容和可以参考原教程链接：
https://huggingface.co/learn/nlp-course/zh-CN/chapter3/1?fw=pt

1. 设置环境

要点：安装必要的库并导入相关模块。我们需要安装transformers和datasets库，用于加载预训练模型和数据集。
代码方法和例子：

!pip install transformers datasets
from transformers import AutoTokenizer, AutoModelForSequenceClassification, TrainingArguments, Trainer
from datasets import load_dataset

解释：transformers库包含各种预训练模型，datasets库提供多种标准数据集。通过导入这些模块，我们可以方便地加载模型和数据集。

2. 加载数据集

要点：使用Hugging Face数据集加载器从库中加载特定数据集，例如GLUE任务中的MRPC数据集。
代码方法和例子：

dataset = load_dataset("glue", "mrpc")

解释：load_dataset函数从Hugging Face数据集库中加载指定的数据集，这里使用的是GLUE中的MRPC数据集。

3. 数据预处理

要点：使用预训练的分词器对数据进行编码。预处理步骤将文本数据转换为模型可接受的输入格式。
代码方法和例子：

tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased"

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

MJy65535

关注关注

6
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Transformer-Hugging Face手册 07/10】微调预训练模型

gongdiwudu的专栏

02-07

3299

使用预训练模型有显着的好处。它可以降低计算成本和碳足迹，并允许您使用最先进的模型，而无需从头开始训练。 🤗 Transformers 提供了针对各种任务的数千个预训练模型的访问权限。当您使用预训练模型时，您可以在特定于您的任务的数据集上对其进行训练。这被称为微调，是一种非常强大的训练技术。

huggingface/transformers 预训练自己的数据

Hope^_^

08-31

281

huggingface/transformers 会自动加载能对应上的参数。

2 条评论您还未登录，请先登录后发表或查看评论

HuggingFace快速入门

HUANGXIN9898的博客

02-14

1157

和 Github 类似，都是Hub(社区)。Hugging Face可以说的上是机器学习界的Github。

huggingface使用预训练模型入门

Akun_2217的博客

11-10

790

huggingface的官方文档的地址：https://huggingface.co/docs/transformers/quicktour。在官方文档中提供了两种加载预训练模型的方式：一是pipline，二是为pytorch/tensorflow/flax框架加载的预训练模型，本文档只对pytorch进行介绍，其他架构除了名字使用方法一样。huggingface提供了很管带有任务头的模型，这里只举个典型例子，加载方式和上述一样，都是from_config/from_pretrain。

基于Hugging Face -Transformers的预训练模型微调

qq_56591814的博客

09-10

7361

Hugging Face transformers课程文章目录Hugging Face transformers课程1. IntroductionTransformers的历史Architectures和checkpointsThe Inference API用pipeline处理NLP问题2. Behind the pipelinetokenizer预处理选择模型Model headsPostprocessing the output后处理3. 构建Trainer API微调预训练模型从Hub上下载d

从Hugging Face上手动下载并加载预训练模型

续起大胡子

11-21

4236

从 Hugging Face 上手动下载并加载预训练模型

HuggingFace学习3：加载预训练模型完成机器翻译（中译英）任务

呆萌的代Ma

04-07

6591

加载模型页面为：https://huggingface.co/liam168/trans-opus-mt-zh-en 文章目录整理文件跑通程序，测试预训练模型拆解Pipeline，逐步进行翻译任务整理文件首先下载模型所需的全部文件：https://huggingface.co/liam168/trans-opus-mt-zh-en/tree/main，将文件全部下载到本地，命名为trans_model 然后创建一个调用模型的python程序文件：use_translate.py 整个文件结构如下：跑

【NLP】第4章从头开始预训练 RoBERTa 模型

sikh_0529的博客

09-25

1万+

将来使用更少的参数或其他类似方法进行蒸馏是一种巧妙的方式，可以充分利用预训练并使其高效地满足许多下游任务的需求。KantaiBERT 是一个类似 DistilBERT 的模型，因为它具有相同的 6 层和 12 个头的架构。您可以加载现有数据集或创建自己的数据集，具体取决于您的目标。您将有足够的变压器知识来面对工业 4.0 的挑战，即使用强大的预训练变压器（例如 GPT-3 引擎），这需要的不仅仅是开发技能来实现它们。中看到的那样，最初的 BERT 模型为最初的 Transformer 模型带来了创新功能。

AdvertiseGen数据集微调ChatGLM-6B模型

05-27

这个文件可能包含模型权重、配置文件以及其他必要的资源，以便在合适的框架（如Hugging Face的Transformers库或PaddlePaddle的PaddleHub）中加载和运行模型。在使用前，确保你有一个支持大模型运行的计算环境，包括...

金融语言模型的进阶指南：预训练与微调的最佳实践

![金融语言模型的进阶指南：预训练与微调的最佳实践]... # 摘要随着金融行业的数字化转型和大数据技术的发展，金融语言模型在自动化报告、市场预测、风险评估等多个领域展现出巨大潜力。本文首先概述了金融语言模型的...

大模型微调训练

03-10

这段Python代码展示了如何利用Hugging Face库中的`Trainer`类来执行简单的微调操作。通过指定训练轮数(`num_train_epochs`)和其他超参数设置，能够有效地控制整个训练流程并保存中间结果以便后续评估。 #### 构建...

自然语言处理用的二分类微调数据SST，可以参考huggingface来具体操作训练

02-14

自然语言处理，预训练模型微调专用数据，SST2 文本分类，情感分类等等类似下游任务都可以用。

大语言模型应用指南：尽量使用示例

AI天才研究院

06-14

716

作者：禅与计算机程序设计艺术大语言模型作为人工智能的重要组成部分，在文本生成、对话系统、机器翻译等领域发挥着关键作用。本文旨在提供一份全面而易于理解的大语言模型应用指南，通过具体的示例帮助开发者和研究人员深入了解其工作原理、实现方法以及在不同场景下的应用策略。 1. 背景介绍随着深度学习技术的发展，大语言模型已成为构建

大模型 | 快速上手 Hugging Face Transformers：完整模型微调训练步骤全攻略

老皮的博客

09-26

1158

Hugging Face 提供了 evaluate 库来计算模型的评估指标。例如，我们可以使用准确率（accuracy）作为评估指标。

HuggingFace的Transformers库Tokenizer和Model使用技巧

最新发布

AI大模型/Python/Java/MySQL技术栈，快来和我一起学习吧 ~

04-08

1324

1. 核心组件构成Transformers库：提供统一API支持30+架构的预训练模型加载，核心抽象类包括AutoModelPipeline。Hub平台：包含250k+模型、数据集及演示应用，采用Git LFS管理大文件版本。：基于Kubernetes的动态扩缩容服务，支持零代码模型部署，提供REST/gRPC接口。2. 模型仓库元数据结构"model_card": { # Markdown文档，含训练数据/偏差声明/使用限制},"metrics": { # 模型评估结果"f1": 0.88。

huggingface NLP-微调一个预训练模型

weixin_40455124的博客

12-14

1386

微调一个预训练模型。

Hugging face 模型微调学习：T5-base的微调

张某文_Lambda的博客

02-24

9945

Hugging face 在 github上开源了一个Transformers库，允许用户上传和下载的预训练的模型，并进行原有模型的基础上进行微调。如此，使得每个 NLPer 必须依靠大量美金才能训练出来的预训练模型，可以轻易的在huggingface网站对自己的数据集上进行微调，并达到很好的效果。这篇文章介绍了自己在探索Hugging face 模型微调的操作过程，希望能帮助到大家。

使用HuggingFace Transformers进行NLP模型微调

xxue345678的博客

09-10

916

evaluate库已经提供了大量评估函数的实现。这里使用了最简单的准确率acc和F1分值。• TP （True Positive）：真*正例，即实际为正类，”正确“预测为正类的样本数。• TN （True Negative）：真*负例，即实际为负类，”正确“预测为负类的样本数。• FP （False Positive）：假*正例，即实际为负类，”错误“预测为正类的样本数。• FN （False Negative）：假*负例，即实际为正类，”错误“预测为负类的样本数。, acc被称为准确率。

在Hugging Face transformers中使用AWQ量化模型

10-09

在Hugging Face Transformers库中，使用AWD-QAModel（即Abridged Wasserstein Distance Quantization Model）通常涉及到将预训练的大型语言模型进行量化，以便于部署到资源有限的设备上，如手机或嵌入式系统。AWD量化是通过Quantization-Aware Training (QAT) 过程实现的，它允许模型在训练过程中就考虑到量化的影响。以下是使用Hugging Face Transformers进行AWD量化模型的基本步骤： 1. **安装依赖**：首先，你需要安装`transformers`库及其相关的量化工具包，例如`transformers quantization`。可以使用pip安装： ``` pip install transformers[quantization] ``` 2. **加载模型**：导入需要的模块并加载预训练的模型，比如BERT、GPT-2等： ```python from transformers import AutoTokenizer, AutoModelForSequenceClassification, is_apex_available, AWDQConfig model_name = "bert-base-uncased" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForSequenceClassification.from_pretrained(model_name) ``` 3. **量化配置**：创建一个AWD量化配置对象： ```python config = AWDQConfig(model=model) ``` 4. **准备数据**：将数据转换成模型接受的格式，并分割成小批次，这对于量化过程很重要。 5. **量化训练**：使用`Trainer` API进行量化训练，这会自动在训练过程中应用量化技巧： ```python trainer = Trainer( model=model, args=..., data_collator=..., train_dataset=..., eval_dataset=..., # 可选 tokenizer=tokenizer, config=config, compute_metrics=..., ) trainer.train() ``` 6. **保存量化模型**：训练完成后，你可以保存量化后的模型： ```python trainer.save_model("path/to/save/awd_quantized_model") ``` 7. **部署**：现在可以将这个量化模型用于推理任务，相比未量化模型，它的内存占用更小，速度更快。