PaddleNLP Transformer预训练模型

跃跃欲试-迪之

于 2024-08-15 13:41:53 发布

阅读量884

点赞数 18

文章标签： transformer 深度学习人工智能

本文链接：https://blog.csdn.net/u011807844/article/details/141220110

版权

随着深度学习的发展，NLP领域涌现了一大批高质量的Transformer类预训练模型，多次刷新了不同NLP任务的SOTA（State of the Art），极大地推动了自然语言处理的进展。 PaddleNLP为用户提供了常用的预训练模型及其相应权重，如 BERT、ERNIE、ALBERT、RoBERTa、XLNet 等，采用统一的API进行加载、训练和调用，让开发者能够方便快捷地应用各种Transformer类预训练模型及其下游任务，且相应预训练模型权重下载速度快、稳定。

预训练模型使用方法

PaddleNLP Transformer API在提供丰富预训练模型的同时，也降低了用户的使用门槛。使用Auto模块，可以加载不同网络结构的预训练模型，无需查找模型对应的类别。只需十几行代码，用户即可完成模型加载和下游任务Fine-tuning。

from functools import partial
import numpy as np

import paddle
from paddlenlp.datasets import load_dataset
from paddlenlp.transformers import AutoModelForSequenceClassification, AutoTokenizer

train_ds = load_dataset("chnsenticorp", splits=["train"])

model = AutoModelForSequenceClassification.from_pretrained("bert-wwm-chinese", num_classes=len(train_ds.label_list))

tokenizer