ValueError: Tokenizer class BaichuanTokenizer does not exist or is not currently imported已解决

三千院本院

已于 2024-01-30 16:44:26 修改

阅读量609

点赞数 3

分类专栏：大模型文章标签：深度学习机器学习人工智能

于 2024-01-30 16:04:07 首次发布

本文链接：https://blog.csdn.net/weixin_42225889/article/details/135935263

版权

大模型专栏收录该内容

5 篇文章 0 订阅

订阅专栏

环境：使用 AutoTokenizer 加载量化后的百川模型
原始加载分词代码

from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained(
    model_id,
    torch_dtype=torch.float32,
    use_fast=False
)

报错：ValueError: Tokenizer class BaichuanTokenizer does not exist or is not currently imported

解决代码：

from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained(
    model_id,
    torch_dtype=torch.float32,
    use_fast=False, 
    trust_remote_code=True
)

添加 trust_remote_code=True

可以在量化时对 Tokenizer 进行保存

tokenizer.save_pretrained('YOUR_PATH')

优惠劵

三千院本院

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ValueError: Tokenizer class BaichuanTokenizer does not exist or is not currently imported已解决

报错：ValueError: Tokenizer class BaichuanTokenizer does not exist or is not currently imported。环境：使用 AutoTokenizer 加载量化后的百川模型。添加 trust_remote_code=True。可以在量化时对 Tokenizer 进行保存。
复制链接

扫一扫