如何使用huggingface微调模型

最新推荐文章于 2024-07-24 10:31:49 发布

明日何其多_

最新推荐文章于 2024-07-24 10:31:49 发布

阅读量5.1k

点赞数 1

分类专栏：深度学习文章标签：自然语言处理

本文链接：https://blog.csdn.net/qsmx666/article/details/121609335

版权

1 安装包

pip install transformers[sentencepiece]
pip install datasets

2 导入数据

from datasets import load_dataset

raw_datasets = load_dataset("glue", "sst2")
raw_datasets

这里使用的是GLUE中SST2数据集，主要针对电影评论来做情感分类（二分类）。
在这里插入图片描述

3 pipeline

在这里插入图片描述
整个流程是先分词，将文本转化为向量，输入到模型，得到输出后再进行后处理操作。

4 数据处理

from transformers import AutoTokenizer

checkpoint = "bert-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)

checkpoint就是预训练好的模型。每个模型都有自己专门的tokeni

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

明日何其多_

关注关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

HuggingFace如何进行预训练和微调？

春华秋实

07-27

196

训练语言模型，尤其是用于完整的 LLM 微调，需要大量的计算资源。展望未来，LLM 的持续探索和创新，加上改进的微调方法，有望推动更智能、更高效和上下文感知的人工智能系统的发展。LoRA 是一种改进的微调方法，它不是微调构成预训练大型语言模型权重矩阵的所有权重，而是微调近似于这个较大矩阵的两个较小矩阵。在这种方法中，使用包含标记样本的数据集来调整模型的权重，从而提高其在特定任务中的熟练程度。特定任务的适配：在微调过程中，模型的参数会根据新数据集进行调整，帮助模型更好地理解和生成与特定任务相关的内容。

自然语言处理用的二分类微调数据SST，可以参考huggingface来具体操作训练

02-14

自然语言处理，预训练模型微调专用数据，SST2 文本分类，情感分类等等类似下游任务都可以用。

6 条评论您还未登录，请先登录后发表或查看评论

NLP | 一文搞懂如何微调抱脸（Hugging Face）模型

Mo 的博客

11-16

686

微调自然语言处理 （NLP）模型需要更改模型的超参数和架构，并且通常会调整数据集以提高模型在给定任务上的性能。您可以通过调整学习率、模型中的层数、嵌入的大小以及各种其他参数来实现这一点。微调是一个耗时的过程，需要牢牢掌握模型和工作。本文将介绍如何微调抱脸模型。

使用 HuggingFace 中的 Trainer 进行 BERT 模型微调，太方便了！！！

最新发布

zhishi0000的博客

07-24

1440

本文介绍了如何使用HuggingFace中的Trainer对BERT模型微调。可以看到，使用Trainer进行模型微调，代码较为简洁，且支持功能丰富，是理想的模型训练方式。。

Hugging face 模型微调学习：T5-base的微调

张某文_Lambda的博客

02-24

8567

Hugging face 在 github上开源了一个Transformers库，允许用户上传和下载的预训练的模型，并进行原有模型的基础上进行微调。如此，使得每个 NLPer 必须依靠大量美金才能训练出来的预训练模型，可以轻易的在huggingface网站对自己的数据集上进行微调，并达到很好的效果。这篇文章介绍了自己在探索Hugging face 模型微调的操作过程，希望能帮助到大家。

如何使用Hugging Face微调大语言模型（LLMs）

FrenzyTechAI的博客

01-26

3790

微调LLM时，了解你的使用场景和要解决的问题至关重要。这将帮助你选择合适的模型，或者帮助你创建一个数据集来微调你的模型。如果你还没有定义你的使用场景，你可能需要重新思考。并非所有的使用场景都需要微调，建议在微调你自己的模型之前，先评估和尝试已经微调过的模型或基于API的模型。例如，我们将使用以下使用场景：我们想要微调一个模型，它可以基于自然语言指令生成SQL查询，然后可以集成到我们的BI工具中。目标是减少创建SQL查询所需的时间，并使非技术用户更容易创建SQL查询。

Huggingface使用

eyouhs的博客

10-30

347

本文主要来自Huggingface NLP学习课程，若想要更进一步，欢迎前往Huggingface官网进行学习

hugging face 模型库的使用及加载 Bert 预训练模型

IT__learning的博客

10-13

2万+

一、hugging face 模型库 Hugging face 是一个专注于 NLP 的公司，拥有一个开源的预训练模型库 Transformers ，里面囊括了非常多的模型例如 BERT、GPT、GPT2、ToBERTa、T5 等。官网的模型库的地址如下：Hugging face 模型库官网 Hugging face 提供的 transformers 库主要用于预训练模型的载入，需要载入三个基本对象： from transformers import BertConfig from transformer

huggingface中Bert模型的简单使用

qq_43422201的博客

08-01

5972

huggingface的Bert模型的简单使用，内含有BertConfig，BertTokenizer，BertModel的使用

基于HuggingFace开发的大语言模型训练

10-24

- **预训练**：模型先在大规模无标注数据上学习通用语言表示，然后在特定任务上进行微调。 - **SFT**：可能是指Soft Actor-Critic (SAC)，一种强化学习算法，适用于连续动作空间的问题。 - **RM**：可能是指...

LLama3 中文大模型进行指令微调的中文聊天语言模型

06-06

Llama3-8B-Chinese-Chat 是一款基于 Meta-Llama-3-8B-Instruct 模型进行指令微调的中文聊天语言模型。该模型针对中文和英文用户进行了专门的优化，具有角色扮演、工具使用、数学计算等多种功能。最新的 v2.1 版本相...

一个基于HuggingFace开发的大语言模型训练、测试工具

03-14

WebUI使得非技术背景的用户也能直观地使用模型，而终端预测则更适合开发者进行更复杂的操作和定制化需求。 2. **低参数量及全参数模型**：这表明该工具不仅支持轻量级模型，也支持包含所有参数的大型模型。轻量模型...

基于HuggingFace开发的Transformers库，使用BERT构建模型完成一基于中文语料的二分类模型.zip

06-05

标题中的“基于HuggingFace开发的Transformers库，使用BERT构建模型完成一基于中文语料的二分类模型”揭示了本项目的核心内容：利用HuggingFace的Transformers库，通过BERT预训练模型来构建一个针对中文文本的二分类...

HuggingFace 模型使用指南

contributed_l的博客

03-25

2186

HuggingFace 模型共有三个部分组成：Tokennizer、Model 和 Post Processing。

【Hugging Face】使用方法和如何挑选一个自己需要的模型

weixin_56463218的博客

08-21

7702

注册之后（国内邮箱免费注册）会有个人主页，用来调试创建自己的模型和数据集右边是网站中的模型使用趋势，左边：注册账户后可以提供免费训练模型和数据集的工作台，创建即可（因为暂时用不到，不做详细说明）

Hugging Face快速入门（重点讲解模型(Transformers)和数据集部分(Datasets)）

热门推荐

iioSnail的博客

08-08

6万+

1. Hugging Face是什么，提供了哪些内容 2. Hugging Face模型的使用（Transformer类库） 3. Hugging Face数据集的使用（Datasets类库）

【计算机视觉 | 自然语言处理】Hugging Face 超详细介绍和使用教程

wzk4869的博客

05-14

1万+

【计算机视觉 | 自然语言处理】Hugging Face 超详细介绍和使用教程

实用篇 | huggingface的一些应用指导

weixin_44649780的博客

05-11

4525

本文主要介绍hugging Face(拥抱脸)的简单介绍以及常见用法，用来模型测试是个好的工具~如下图所示左边框是各项任务，包含多模态（Multimodal），计算机视觉(Computer Vision)，自然语言处理(NLP)等，右边是各任务模型。本文测试主要有。

huggingface格式的模型怎么使用

09-05

使用Huggingface格式的模型可以按照以下步骤进行操作。首先，我们需要导入预训练好的模型和相应的tokenizer。模型和tokenizer可以根据任务的不同而选择不同的预训练模型，例如BERT、GPT等。接下来，我们可以使用tokenizer对输入进行分词、padding等预处理操作。例如，我们可以使用以下代码对句子进行处理： ``` from transformers import AutoTokenizer tokenizer = AutoTokenizer.from_pretrained("模型名称") inputs = tokenizer("This is the first sentence.") ``` 然后，我们需要导入Trainer并将训练所需的模型、数据和tokenizer一次性传入。在Trainer中，可以设置评价指标compute_metrics，可以通过将模型的输出结果输入到metric.compute来自动计算结果。对于二分类任务，我们可以将模型输出的最后一维是2，取较大的一项作为分类结果。最后，我们可以调用trainer.train()来进行训练。这将根据给定的数据对模型进行训练。完成以上步骤后，我们就可以使用Huggingface格式的模型进行任务相关的操作了。需要注意的是，以上步骤只是一种常见的使用Huggingface格式的模型的方法，具体使用方式还取决于任务的需求和模型的具体特性。123 #### 引用[.reference_title] - *1* *2* [如何使用huggingface微调模型](https://blog.csdn.net/qsmx666/article/details/121609335)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [使用Huggingface、PEFT和LoRA训练大型语言模型（LLM）的demo代码](https://download.csdn.net/download/qq_22593423/88203992)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]