Hugging Face 预训练模型的下载及使用

3 篇文章 0 订阅

以bert-base-chinese为例,首先到hugging face的model页,搜索需要的模型,进到该模型界面。
在这里插入图片描述
在这里插入图片描述
在本地建个文件夹:

mkdir -f model/bert/bert-base-chinese

将config.json、pytorch_model.bin(与tf_model.h5二选一,用什么框架选什么)、tokenizer.json、vocab.txt下载到刚才新建的文件夹中。(对于一般的模型config.json、tokenizer.json、pytorch_model.bin/tf_model.h5是必须下的,其他看情况而定,为了方便也可以把该界面的文件全部下载下来。)

怎么用下载下来的模型呢?

import torch
from transformers import BertModel, BertTokenizer

tokenizer = BertTokenizer.from_pretrained("model/bert/bert-base-chinese/")
model = BertModel.from_pretrained("model/bert/bert-base-chinese/")

sentence = "今天天气怎么样?"
# add_special_tokens=True 则前后会分别加上<SOS> <EOS>的embedding
input_ids = tokenizer.encode(sentence, add_special_tokens=True)
input_ids = torch.tensor([input_ids])
with torch.no_grad():
    last_hidden_states = model(input_ids)[0]  # Models outputs are now tuples
# last_hidden_states.shape is (1, 8, 768)
  • 5
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值