Transformers模型微调

数据集处理库:Hugging Face Datasets

from datasets import load_dataset
dataset=load_dataset("hunggingface数据集名字")

Datasets.load_dataset实现原理

在这里插入图片描述

构造DatasetBuilder 类的主要配置BuilderConfig

若果想向数据集添加额外的属性,例如标签。主要有两种方法来填充BuilderConfig类或其子类的属性:

  • 在datasets DatasetBuilder.BUILDER_CONFIGS()属性中提供预定义的BuilderConfig类实例;
  • 当调用load_datasets()时,各参数默认值会直接读取BuilderConfig类的预定义值,否则会被覆盖;
    在这里插入图片描述

实际构造数据集的类DatasetsBuilder

在这里插入图片描述

数据预处理策略

  • 填充(padding)
  • 截断(Truncation)

Transformers微调训练模块Trainer

trainer=Trainer(
	model=model,   #模型加载
	args=training_args,		#参数加载
	train_dataset=small_train_dataset,		#训练数据加载
	eval_dataset=small_eval_dataset,		#验证数据加载
	compute_metrics=compute_metrics,		#评估比较加载
)

trainer.train()

Transformers模型评估库Evaluate

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值