transformers Model

ZhangTao_zata

已于 2024-07-08 21:42:21 修改

阅读量209

点赞数 2

文章标签： python

于 2024-06-20 23:25:09 首次发布

本文链接：https://blog.csdn.net/qq_41685627/article/details/139844765

版权

huggingface

☆ 问题描述

在 transformers 框架中，Model 模块是核心组件之一，提供了多种预训练模型及其相关功能，广泛应用于自然语言处理（NLP）任务。
在这里插入图片描述

Model

基本代码

# 导入相关文件
from transformers import AutoConfig, AutoModel, AutoTokenizer

# 在线加载模型
model = AutoModel.from_pretrained("hfl/rbt3", force_download=True)

# 加载本地模型
model = AutoModel.from_pretrained("rbt3")

# 查看模型参数
model.config
#或
config = AutoConfig.from_pretrained("./rbt3/")
config

类： AutoModelForSequenceClassification

AutoModelForSequenceClassification 是 Hugging Face Transformers 库中的一个类，用于根据指定的预训练模型自动选择相应的序列分类模型。这个类的主要作用是根据提供的预训练模型架构名称或路径，加载对应的模型，并针对序列分类任务进行微调或推理。

https://huggingface.co/models

model_name = "bert-base-uncased"  # 替换为你想要使用的预训练模型的名称
model = AutoModelForSequenceClassification.from_pretrained(model_name)

TrainingArguments

1. 概述

TrainingArguments 是 Hugging Face 的 transformers 库中用于配置模型训练的重要类。
它允许你指定训练过程中的各种参数，如学习率、批量大小、训练周期数等。

2. 常见参数

output_dir: 指定模型和训练日志的输出目录。
overwrite_output_dir: 如果设为 True，则在每次运行时会覆盖 output_dir 中的内容。
per_device_train_batch_size: 每个设备（GPU 或 CPU）上的训练批量大小。
num_train_epochs: 训练周期数，即模型将遍历整个训练数据集的次数。
learning_rate: 初始学习率，控制每次更新模型参数时的步长大小。
logging_dir: 指定存储训练日志的目录。
save_total_limit: 控制保存模型的数量限制。

3. 使用示例

from transformers import TrainingArguments

# 定义训练参数
training_args = TrainingArguments(
    output_dir='./results',          # 输出目录
    overwrite_output_dir=True,       # 是否覆盖输出目录
    per_device_train_batch_size=8,   # 每个设备的训练批量大小
    num_train_epochs=3,              # 训练周期数
    learning_rate=1e-4,              # 初始学习率
    logging_dir='./logs',            # 日志目录
    save_total_limit=5               # 最多保存的模型数量
    evaluation_strategy="epoch",             # 每个训练周期结束后进行评估
    save_strategy="epoch",                   # 每个训练周期结束后保存模型
)