Transformers 保存并加载模型 | 八

本文介绍了如何保存和重新加载微调的Transformer模型,如BERT、GPT、GPT-2和Transformer-XL。需要保存的文件包括PyTorch序列化的模型、JSON格式的配置文件以及词汇表。默认文件名和从预训练模型加载的步骤也被详细阐述。
摘要由CSDN通过智能技术生成

作者|huggingface 编译|VK 来源|Github

本节说明如何保存和重新加载微调模型(BERT,GPT,GPT-2和Transformer-XL)。你需要保存三种文件类型才能重新加载经过微调的模型:

这些文件的默认文件名如下:

  • 模型权重文件:pytorch_model.bin
  • 配置文件:config.json
  • 词汇文件:vocab.txt代表BERT和Transformer-XL,vocab.json代表GPT/GPT-2(BPE词汇),
  • 代表GPT/GPT-2(BPE词汇)额外的合并文件:merges.txt

如果使用这些默认文件名保存模型,则可以使用from_pretrained()方法重新加载模型和tokenizer。

这是保存模型,配置和配置文件的推荐方法。词汇到output_dir目录,然后重新加载模型和tokenizer:

from transformers im
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值