T5模型在训练过程中实时计算验证集上准确度，自定义compute_metrics

最新推荐文章于 2023-11-01 10:15:08 发布

JY HUA

最新推荐文章于 2023-11-01 10:15:08 发布

阅读量1.4k

点赞数 1

分类专栏：人工智能 nlp 文章标签：自然语言处理

本文链接：https://blog.csdn.net/CallMeYunzi/article/details/115724293

版权

nlp 同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

人工智能

5 篇文章 0 订阅

订阅专栏

T5模型不同于BERT类模型，它是一个seq2seq模型，在训练过程中预测结果实时返回的是字典长度的置信度。

将T5用于解决NLU问题时，想要在训练过程中实时监测在验证集上的准确度，也很简单，只需要添加自定义compute_metrics函数。

以下为采用transformers框架训练添加自定义compute_metrics函数的代码：

def compute_accuracy(pred):
    ## 1.处理 pred.predictions
    # 每个样本的预测结果为vocab大小
    predict_res = torch.Tensor(pred.predictions[0]) # size：[验证集样本量, label的token长度, vocab大小]
    pred_ids = predict_res.argmax(dim=2)

    ## 2.处理 pred.label_ids
    labels_actual = torch.LongTensor(pred.label_ids)
    
    ## 3.计算accuracy
    total_num = labels_actual.shape[0]
    acc = torch.sum(torch.all(torch.eq(pred_ids, labels_actual), dim=1))/total_num
    return {'accuracy': acc}

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    compute_metrics=compute_accuracy # 添加自定义compute_metrics
)

推荐使用wandb监控训练状态，实时可见此自定义accuracy

JY HUA

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
T5模型在训练过程中实时计算验证集上准确度，自定义compute_metrics

T5模型不同于bert类模型，它是一个seq2seq模型，它在训练过程中预测结果实时返回的是字典长度的置信度，想要在训练过程中实时监测在验证集上的准确度，可以自己添加自定义compute_metrics函数。以下为采用transformers框架训练添加自定义compute_metrics函数的代码：def compute_metrics(pred): ## 1.处理 pred.predictions # 每个样本的预测结果为vocab大小 predict_res = to
复制链接

扫一扫