使用Transformers离线模型（以bert模型为例）

最新推荐文章于 2024-05-24 17:52:00 发布

呆萌的代Ma

最新推荐文章于 2024-05-24 17:52:00 发布

阅读量5.6k

点赞数 3

分类专栏： pytorch/神经网络文章标签： bert 深度学习 tensorflow

本文为CSDN博主"呆萌的代Ma"原创文章，转载请注明博客链接：https://blog.csdn.net/weixin_35757704/

本文链接：https://blog.csdn.net/weixin_35757704/article/details/120625431

版权

pytorch/神经网络专栏收录该内容

60 篇文章 27 订阅

订阅专栏

首先需要安装transformers：pip install transformers

以bert-base-uncased为例，进入网站：https://huggingface.co/bert-base-uncased/tree/main，可以看到这个模型的所有文件，包括使用pytorch与tensorflow的模型。

在这里插入图片描述

我是用的是pytorch，因此下载这里的3个文件：

config.json
pytorch_model.bin
vocab.txt

把它们放在同一个文件夹中，然后写一个测试小demo：

from transformers import BertModel, BertTokenizer
import torch

MODEL_PATH = './my_bert_model' # 装着上面3个文件的文件夹位置
tokenizer = BertTokenizer.from_pretrained(pretrained_model_name_or_path=MODEL_PATH)
text = 'Follow their code on GitHub. Ha'
indexed_tokens = tokenizer.encode(text)  # 对文本编码
tokens_tensor = torch.tensor([indexed_tokens])  # 文本编码转tensor
model = BertModel.from_pretrained(MODEL_PATH)  # 读取预训练模型
# 下面按照pytorch模型来验证这个结果
model.eval()
with torch.no_grad():
    outputs = model(tokens_tensor)
    print(outputs[0].shape)  # shape = torch.Size([1, 11, 768])
    print(outputs[0])

运行成功即可

呆萌的代Ma

关注

3
点赞
踩
25

收藏

觉得还不错? 一键收藏
打赏
4
评论
使用Transformers离线模型（以bert模型为例）

首先需要安装transformers：pip install transformers以bert-base-uncased为例，进入网站：https://huggingface.co/bert-base-uncased/tree/main，可以看到这个模型的所有文件，包括使用pytorch与tensorflow的模型。我是用的是pytorch，因此下载这里的3个文件：config.jsonpytorch_model.binvocab.txt把它们放在同一个文件夹中，然后写一个测试小demo
复制链接

扫一扫