HugginngFace的Trainer的常见用法

萱仔学习自我记录

于 2024-10-05 23:57:31 发布

阅读量29

点赞数 1

文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44117805/article/details/142712124

版权

Hugging Face 的 Trainer 类提供了一个高度集成的训练、评估和预测接口，能大幅简化我们预训练和微调的工作量。比如我最近最常会遇到的用监督学习微调语言模型任务为例，只需要定义一个Trainer，然后传入我想要训练的模型和数据集，就可以直接运行微调任务。

以下是 Trainer 的一些常见用法和参数配置：

首先，Trainer 可以通过提供模型、数据集、训练参数等来进行快速的模型训练：

from transformers import Trainer, TrainingArguments, AutoModelForSequenceClassification, AutoTokenizer
from datasets import load_dataset

# 加载预训练模型和分词器
model = AutoModelForSequenceClassification.from_pretrained("bert-base-uncased", num_labels=2)
tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")

# 加载数据集
dataset = load_dataset("glue", "sst2")
encoded_dataset = dataset.map(lambda x: tokenizer(x['sentence'], padding="max_length", truncation=True), batched=True)

# 设置训练参数
training_args = TrainingArguments(
    output_dir="./results",          # 模型保存路径
    evaluation_strategy="epoch",     # 每个epoch进行一次评估
    learning_rate=2e-5,              # 学习率
    per_device_train_batch_size=16,  # 每个设备的训练批次大小
    per_device_eval_batch_size=16,   # 每个设备的评估批次大小
    num_train_epochs=3,              # 训练轮数
    weight_decay=0.01,               # 权重衰减
)

# 创建Trainer
trainer = Trainer(
    model=model,                         # 预训练模型
    args=training_args,                  # 训练参数
    train_dataset=encoded_dataset['train'],  # 训练数据集
    eval_dataset=encoded_dataset['validation'],  # 评估数据集
)

# 开始训练
trainer.train()

萱仔学习自我记录

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

萱仔学习自我记录 CSDN认证博客专家 CSDN认证企业博客

码龄6年

41: 原创

1万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

1102: 积分

506: 粉丝

610: 获赞

0: 评论

407: 收藏

私信

关注

热门文章

分类专栏

最新评论

萱仔求职系列——3.1 力扣面试150题目——数组&字符串第一弹
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
旧项目新学习-天池-零基础入门NLP - 新闻文本分类 - BERT算法处理
CSDN-Ada助手: 恭喜您在博客中分享了关于天池NLP新闻文本分类以及BERT算法处理的学习心得，这对于零基础入门的读者来说应该非常有帮助。希望您能够继续坚持创作，分享更多关于NLP领域的知识和经验。下一步，建议您可以尝试深入探讨一些NLP领域的前沿技术或者应用案例，让读者更深入地了解这个领域的发展方向和实际应用。期待您的更多精彩文章，加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
旧代码学习上传记录-天池-零基础入门NLP - 新闻文本分类
CSDN-Ada助手: 非常感谢您分享了这篇博客，对于学习旧代码和零基础入门NLP的经验分享，我觉得很受启发。除了随机森林算法，您还可以尝试使用其他常见的NLP算法，比如朴素贝叶斯、支持向量机等，以及深度学习模型如LSTM、BERT等来进行文本分类任务。此外，您可以了解一些NLP预处理技术，如分词、去停用词、词袋模型等，来提升模型的准确性和效率。希望您可以继续分享更多关于NLP学习的经验和技巧，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。