解决BERT模型bert-base-chinese报错（无法自动联网下载）

最新推荐文章于 2025-04-14 16:53:47 发布

搬砖修狗

最新推荐文章于 2025-04-14 16:53:47 发布

阅读量5k

点赞数 42

文章标签： bert 人工智能深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_70574207/article/details/138312224

版权

一、下载问题

hugging-face是访问BERT模型的最初网站，但是目前hugging-face在中国多地不可达，在代码中涉及到该网站的模型都会报错，本文我们就以bert-base-chinese报错为例，提供一个下载到本地的方法来解决问题。

二、网站

google-bert (BERT community)This organization is maintained by the transformers team at Hugging Face and contains the historical (pre-"Hub") BERT checkpoints.https://hf-mirror.com/google-bert这个网站可以搜索所需的模型文件并下载到本地

三、下载说明

1.下载模型文件：

无论你是下载什么模型（pytorch版）文件夹，应该包含以下三个文件：

config.json
vocab.txt
pytorch_model.bin

2.更改文件名！

很多下载的模型文件夹里面上述三个文件名字可能会有不同，一定要注意！以清华OpenCLaP上下载下来的民事BERT为例，其中包含了三个文件对应的名字为：

bert_config.json 看到没有！！这个前面多了个bert_,一定要改掉！~~bert_~~config.json
vocab.txt
pytorch_model.bin

三个文件一定要与第一步中的结构一样，名字也必须一样

3.将文件放入自己的文件夹

这里我们在自己的工程目录里新建一个文件夹：bert_localpath,将三个文件放入其中，最终结构如下：

bert_localpath

config.json
vocab.txt
pytorch_model.bin

4.加载

使用 .from_pretrained("xxxxx")方法加载，本地加载bert需要修改两个地方，一是tokenizer部分，二是model部分：
step1、导包： from transformers import BertModel，BertTokenizer
step2、载入词表： tokenizer = BertTokenizer.from_pretrained("./bert_localpath/") 这里要注意！！除了你自己建的文件夹名外，后面一定要加个/，才能保证该方法找到你的vocab.txt
step3、载入模型： bert = BertModel.from_pretrained("./bert_localpath") 然后，这个地方又不需要加上/

5.使用

至此，你就能够使用你的本地bert了！！例如~outputs = bert(input_ids, token_type_ids, attention_mask)来获得token的编码输出output

over，最近在准备比赛的时候遇到的问题，综合各篇文章解决问题，在此记录一下，希望能帮到你，如果觉得我写的有问题的或者太简单的，可以去看看其他人的

博客等级

码龄3年

5
原创

63
点赞

84
收藏

22
粉丝

关注

私信

热门文章

上一篇：: python基础一

下一篇：: 爬虫的基础知识

最新评论

解决BERT模型bert-base-chinese报错（无法自动联网下载）
2301_79690215: 请问本地开VPN训练过一次，之后不用开就可以训练，能不能将本地的模型迁移到服务器上
爬虫的基础知识
CSDN-Ada助手: 恭喜用户写了第5篇博客《爬虫的基础知识》，内容涉及到了技术领域的重要知识点，让读者们有机会了解与学习。希望用户能够继续保持创作的热情，不断分享自己的见解和经验。建议用户在以后的创作中，可以深入探讨一些高级技术或者实践经验，让读者们得到更多的启发和帮助。期待用户更多优质的博客作品！
python基础一
CSDN-Ada助手: 恭喜你完成了第三篇博客！看到你探索蓝桥杯python备赛的内容，我感到非常高兴。你对python基础的了解和实践能力令人钦佩。希望你能继续保持这种积极的创作态度，不断分享你的学习心得和经验。作为下一步的创作建议，或许你可以考虑深入研究一些高级的python技术或者挑战更具挑战性的题目，这样可以更好地提升自己的编程水平。我期待着你未来更多博客的发布！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
什么是网络地址什么是主机地址以及广播地址
CSDN-Ada助手: 非常棒的博客！你对网络地址、主机地址和广播地址的解释非常清晰易懂。继续写作，将有助于更多人理解和学习相关知识。除了你在标题和摘要中提到的内容，还有一些与IP地址相关的扩展知识和技能。一个重要的扩展知识是子网划分和子网掩码。通过对IP地址和子网掩码进行逻辑“与”运算，可以确定主机所在的子网，进而进行更精细的网络划分和管理。此外，了解IP地址分类和私有IP地址也是很有帮助的。IP地址分类将IP地址分为A、B、C、D和E五类，每类有不同的网络地址和主机地址范围。而私有IP地址是指用于内部网络的IP地址范围，不会在公共互联网中被路由转发。希望这些扩展知识能够对你的博客写作提供一些参考。再次感谢你的分享，期待你的下一篇文章！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

搬砖修狗 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。