自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 在docker容器中安装cmake

项目要求我要在docker中安装cmake,但是网上大部分方法要么是在宿主机上安装,要么是需要写一个Dockerfile然后重启创建一个容器。然后我尝试了在现有的容器中进行安装最终成功,安装过程参考了这篇文章。

2025-05-21 10:17:43 240

原创 4月14日 实习日记 | vllm源码解读 (一)

通过使模型类的构造函数统一,模型运行器可以轻松地创建和初始化模型,而无需知道特定的模型类型。通过使构造函数统一,我们可以轻松地创建视觉模型和语言模型,并将它们组合成视觉语言模型。启动服务的话,会执行vllm/entrypoints/cli/main.py 这个文件,解析命令行的参数,然后这个文件里又包含了下面三行,会遍历 CMD_MODULES 列表,对各个模块的子命令进行初始化。这个类当中,首先可以看到的第一个功能性函数是 generate(),需要关注的参数是prompts,可以是单个值或者一个序列、

2025-04-14 17:10:40 751

原创 在docker中使用vLLM部署大模型

注意,如果在启服务的时候遇到了下面这个错误,需要进入到模型所在的文件夹,找到config.json,修改其中的max_position_embeddings字段和你的max_model_len匹配。这里注意,–limit-mm-per-prompt参数尽量加上,如果不加的话,一个对话里最多只能有一张图片,多了就会报错400,这里我随便设成了5,一个对话中对于5张图片就会报400。这个网站就可以实现,直接把转换内容替换到上面 “url” 的值就可以了,因为那个编码太长了,贴一张图片作为例子。

2025-04-11 15:04:24 2135 1

原创 4.10 实习日记

模型占用显存的情况以及加载模型过后可用的显存情况在vllm源码中/v1/worker/gpu_worker.py中的determine_available_memory函数中,相关的代码段是。KVcache对于显存的需求量在vllm源码中v1/core/kv_cache_utils.py文件的check_enough_kv_cache_memory函数中定义的,具体代码段时。找到一个安装了modelscope的conda环境,进入checkpoints文件夹,执行下载命令。请求时,会出现内存不足的情况。

2025-04-11 11:37:22 935

原创 4.9 实习日记

昨天已经把vllm.tar传到了10.20.25.250这台机器的/home/zhangzichao/docker_images下面,使用下面的命令构建镜像加载好镜像之后,采用下面的命令启动一个容器,用于部署vllm因为第一次在250这台服务器部署应用,所以在运行上面的命令之前,需要先使用查看本机没有被占用的端口,最后选定启动容器之后,直接从vscode中进入容器内部,实质上也是执行下面的命令然后启动vllm服务。

2025-04-09 18:31:50 859

原创 4.8日 实习日记

首先要在服务器中的一个docker中启动vllm服务启动成功使用测试脚本测试最大并发数lenlenlenlenlen这段代码是超哥写的测试代码。但是这段代码有一个问题,经过调试以及阅读博客,发现流式响应response对象中没有usage对象,没办法统计提问消耗的 token,回答消耗的 token,以及总共消耗的 token 数。,我在网上找到了这个帖子,里面说可以通过 tiktoken进行统计。然后我让deepseek写了一段代码来统计这些数据。一堆#的地方是我改动过的地方。

2025-04-08 18:33:50 751

原创 Leetcode:二叉树层序遍历

而这种层序遍历方式就是图论中的广度优先遍历,只不过我们应用在二叉树上。层序遍历一个二叉树。就是从左到右一层一层的去遍历二叉树。需要借用一个辅助数据结构即队列来实现,

2025-03-21 21:03:06 234

原创 代码随想录训练营第三天

链表是一种通过指针串联在一起的线性结构,每一个节点由两部分组成,一个是数据域一个是指针域(存放指向下一个节点的指针),最后一个节点的指针域指向null(空指针的意思):下面就是单链表。

2025-03-15 17:39:03 302

原创 代码随想录第二天| 长度最小的子数组、螺旋矩阵II、区间和、开发商购买土地

力扣题目链接

2025-03-13 11:33:50 135

原创 代码随想录第一天|移除元素、移除元素、有序数组的平方

示例 1: 给定 nums = [3,2,2,3], val = 3, 函数应该返回新的长度 2, 并且 nums 中的前两个元素均为 2。示例 2: 给定 nums = [0,1,2,2,3,0,4,2], val = 2, 函数应该返回新的长度 5, 并且 nums 中的前五个元素为 0, 1, 3, 0, 4。输入: nums = [-1,0,3,5,9,12], target = 9。输入: nums = [-1,0,3,5,9,12], target = 2。元素的顺序可以改变。

2025-03-13 00:07:30 177

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除