huggingface加载预训练模型

Alex Ruan

已于 2022-05-16 19:15:47 修改

阅读量1.3k

点赞数

分类专栏： pytorch 文章标签： pytorch python

于 2022-05-16 16:17:10 首次发布

原文链接：https://blog.csdn.net/qq_33293040/article/details/109534923

版权

pytorch 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

在加载前需要统一模型文件名。比如bin文件都得叫pytorch_model.bin，配置文件都得叫config.json，词汇文件都得叫vocab.txt或json。这个是因为源码中的判断要求，所以别问，问就是改名。(https://blog.csdn.net/qq_33293040/article/details/109534923)

RoBERTa中的merge.txt和vocab.json是什么

Bert采用的是字符级别的BPE编码，直接生成词表文件。Roberta采用的是**byte level的BPE(BBPE)**编码，预训练结果中的merges.txt中存储了BBPE过程中merge得到的所有token，可以简单理解成就是字典。vocab.json则是一个字典中基本单元到索引的映射。转换的过程是，根据merges.txt将输入的文本tokenize化，再根据vocab.json中的字典映射到对应的索id。

其他参考
https://blog.csdn.net/IT__learning/article/details/120741368

生成自己的vocab.json和merges.txt

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
huggingface加载预训练模型

在加载前需要统一模型文件名。比如bin文件都得叫pytorch_model.bin，配置文件都得叫config.json，词汇文件都得叫vocab.txt或json。这个是因为源码中的判断要求，所以别问，问就是改名。(https://blog.csdn.net/qq_33293040/article/details/109534923)RoBERTa中的merge.txt和vocab.json是什么Bert采用的是字符级别的BPE编码，直接生成词表文件。Roberta采用的是**byte level的B
复制链接

扫一扫

专栏目录

Alex Ruan CSDN认证博客专家 CSDN认证企业博客

码龄6年

72: 原创

24万+: 周排名

26万+: 总排名

27万+: 访问

: 等级

1764: 积分

27: 粉丝

151: 获赞

42: 评论

559: 收藏

私信

关注

热门文章

分类专栏

SQL 1篇
Linux 4篇
tips 17篇
Paper Basis 4篇
python 32篇
环境安装 16篇
pytorch 20篇
feelings 3篇
numpy 2篇
Pandas 2篇
Black_Hat_Python 17篇
ML 10篇
debris 5篇
c/cpp 2篇

最新评论

c++/c初始化数组全为0
Qutter: 你出错的原因是 sizeof(sum) 事实上求的是指针大小。memset 第三个参数的 count 的参数应该是字节数，所以对于长度为 100 的数组，count 参数应当设定为 sizeof(int) * 100
PyTorch中view、permute、reshape对比
福尔侯林: 挺清楚的
NCCL Error 2: unhandled system error | data parallel on GPU A100(多卡DP训练报错)
悠闲的黑�: 大佬我也是这个问题，服务器上有8个gpu。请问这个命令行输入是在哪输入的，是改服务器上的环境变量吗还是改什么东西
CondaHTTPError: HTTP 000 CONNECTION FAILED for url ＜https://conda.anaconda.org/conda-forge/win-64/c
Citrus-1120: 也可以按照他的办法删掉相应文件，然后重新打一下安装代码
reg query报错系统找不到指定的注册表项或值。
zldtll: /s 是查子项 /v 是查值这俩不太一样

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。