transformers库中的.from_pretrained()

最新推荐文章于 2025-03-10 13:09:39 发布

长命百岁️

最新推荐文章于 2025-03-10 13:09:39 发布

阅读量1.9w

点赞数 3

分类专栏： PyTorch 文章标签：深度学习自然语言处理人工智能

本文链接：https://blog.csdn.net/qq_52852138/article/details/128474948

版权

PyTorch 专栏收录该内容

26 篇文章

订阅专栏

前言

在跑Faspect代码时，对transformer系列的预训练模型加载方式比较好奇，因此记录

from transformers import AutoConfig, FlaxAutoModelForVision2Seq

# Download configuration from huggingface.co and cache.
config = AutoConfig.from_pretrained("bert-base-cased")
model = FlaxAutoModelForVision2Seq.from_config(config)

在使用Huggingface提供的transformer系列模型时，会通过model.from_pretrained函数来加载预训练模型。

from_pretrainde函数原型为

def from_pretrained(cls, pretrained_model_name_or_path: Optional[Union[str, os.PathLike]], *model_args, **kwargs):
# 从预训练的模型配置实例化预训练的 Pytorch 模型

对加载预训练模型地址的介绍

pretrained_model_name_or_path:
- 一个字符串，模型id，该模型在 huggingface.co的模型仓库中存在。有效的模型id可以是在 root-level 的，比如 bert-base-uncased，或者是在一个用户或者组织名的命名空间下的，比如 dbmdz/bert-base-german-cased
- 一个文件夹路径，该文件夹包含使用 save_pretrained() 保存的模型权重，比如 ./my_model_dir
- 指向 tensorflow index checkpoint file 的路径，eg../tf_model/model.ckpt.index
- 包含.msgpack格式的flax checkpoint file的模型文件夹的路径