运行vllm报错：data did not match any variant of untagged enum PyPreTokenizerTypeWrapper

Cyril_KI

已于 2024-06-04 10:23:46 修改

阅读量7.5k

点赞数 7

分类专栏： LLM 文章标签： llm vllm tokenizers transformers

于 2024-06-03 23:47:00 首次发布

本文链接：https://blog.csdn.net/Cyril_KI/article/details/139425731

版权

情况描述

环境：

linux
transformers 4.41.2
tokenizers 0.19.1
torch 2.3.0
vllm 0.4.3

在使用vllm运行xverse/XVERSE-13B-256K时(代码如下)：

from vllm import LLM, SamplingParams

llm = LLM(
    model=args.pretrain, 
    trust_remote_code=True, seed=args.seed
)

报错如下

File "/cfs/xxx/xxx.py", line 155, in <module>
    vllm_main

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Cyril_KI

关注关注

7
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

Exception:data did not match any variant of untagged enum PyPreTokenizerTypeWrapper at line 69 解决方案

weixin_43178406的博客

07-18

10万+

本文主要介绍了Exception: data did not match any variant of untagged enum PyPreTokenizerTypeWrapper at line 69 column 3解决方案，希望能对使用大模型的同学们有所帮助。文章目录 1. 问题描述 2. 解决方案

解决vllm推理框架内在开启多显卡时报错问题

洛阳泰山的博客

03-26

3872

一般报错的原因情况有三种。

参与评论您还未登录，请先登录后发表或查看评论

Mistral模型加载报错data did not match any variant of untagged enum PyPreTokenizerTypeWrapper

最新发布

weixin_63184153的博客

03-17

527

我用的Transformers的版本是：4.28.1，版本太低了。更新Transformers即可解决该问题。

llama3.3 inference报错：Exception: data did not match any variant of untagged enum ModelWrapper

CallMeYunzi的博客

01-24

1242

【代码】llama3.3 inference报错：Exception: data did not match any variant of untagged enum ModelWrapper。

python vllm报错解决方法

qq_39364337的博客

01-23

780

命令行中添加临时环境变量, 注意路径要找自己的python环境路径.因为是临时的环境变量,打开新的命令行窗口就失效了.可以将其写入~/.bashrc 文件中。

vllm报错out of memory解决

a61022706的博客

06-12

4692

通过调低–gpu-memory-utilization的比例（默认为0.9），可以避免此问题。

Exception

lemon_cai

07-03

267

昇腾910B+MindIE实现Qwen类模型推理之问题解决

m0_55308155的博客

02-03

674

6、镜像：[MindIE]ascend_24.1.rc3-cann_8.0.rc3.beta1-py_3.10-ubuntu_20.04-aarch64-mindie_1.0.RC3。2、操作：升级transformers。此处指定了版本为：4.45.2，同步会升级tokenizers-0.20.3。

Exception: Error while attempting to unpickle Tokenizer: data did not match any variant of untagged enum ModelWrapper at line

01-23

当尝试反序列化 `Tokenizer` 数据并遇到了错误提示 "did not match any variant of untagged enum ModelWrapper" 时，这表明数据结构与预期不匹配[^1]。 #### 错误原因解析此类型的错误通常是由于保存模型或 ...

data did not match any variant of untagged enum

01-10

fn parse_untagged(value: serde_json::Value) -> Result, Box<dyn Error>> { match value { serde_json::Value::Number(ref num) if num.is_i64() => Ok(UntaggedEnum::Int(num.as_i64().unwrap() as i32)), ...

qdrant_client.http.exceptions.UnexpectedResponse: Unexpected Response: 400 (Bad Request) Raw response content: b'{"status":{"error":"Format error in JSON body: data did not match any variant of untagged enum BatchVectorStruct at line 1 column 8451277"},"time":0.0}' 怎么改正python这种错误

07-14

这个错误是由于请求的 JSON 数据格式错误导致的。要解决这个问题，你需要检查你的 JSON 数据并确保它符合请求的要求。下面是一些可能导致错误的常见问题和解决方法： 1. 检查 JSON 数据的语法：确保 JSON 数据中的...

llava 导入process报错

weixin_46124467的博客

01-19

392

【代码】llava 导入process报错。

code online format

any2mobile的专栏

09-09

627

php online format js online format

【阅读总结】Variant Effect Predictor: EVE 深度生成模型预测致病突变

lasgalen

08-15

873

本系列旨在整理Debora课题组一系列基于深度生成模型预测致病突变的工作，包括EVE、Tranception、TranceptEVE、EVEscape和popEVE，讨论数据来源与处理、模型架构与训练、性能测试与实例。

《Python基础教程》内容总览篇（持续更新中）

热门推荐

weixin_43178406的博客

08-26

29万+

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。个人精心开设的《Python基础课程》专栏订阅量接近900，帮助不少同学解决了Bug。

从零开始：使用ArcBlock构建你自己的DID

YekForth的博客

09-23

151

DID提供了一种去中心化的方式来验证和管理数字身份，使得用户可以更好地掌握自己的身份信息。在本文中，我们将介绍如何使用ArcBlock构建和管理自己的DID，并提供相关的源代码示例。DID为数字身份管理提供了一种去中心化的解决方案，使得用户可以更好地掌控自己的身份信息。ArcBlock的SDK提供了丰富的功能和工具，帮助开发者轻松地构建和管理DID。在上述代码中，我们使用ArcBlock的SDK验证了之前创建的DID的有效性。有了密钥对之后，我们可以使用ArcBlock的SDK创建自己的DID。

Stable diffusion 3.5本地运行环境配置记录

寸先生的AI道路

11-04

1659

一名古代风格的中国女学生坐在现代的计算机教室里面学习编程”安装transformer和tokenizer。Jupyter能使用Anaconda虚环境。解决：安装高于Pytorch>2.0。安装量化库节约VRAM GPUs。安装最新版本的diffuser。安装sentencepiece。根据项目需要安装其他库。

[nlp] tokenizer加速：fast_tokenizer=True

心宝的博客

07-25

3223

快速的 tokenizer 通常使用一些技巧来减少 tokenization 过程中的计算量，以便更快地处理文本数据。这样可以避免在字符串中搜索和替换子字符串的操作，从而提高 tokenization 的速度。另外，快速的 tokenizer 还可以使用一些预处理技术，例如将单词转换为其基本形式（即去掉后缀或前缀），或者将多个连续的空格或标点符号合并为一个空格或标点符号。总之，快速的 tokenizer 通过使用一些优化技巧和预处理技术来减少计算量，从而提高 tokenization 的速度。