使用 vllm 部署 MiniCPM-o 2.6

最新推荐文章于 2025-03-29 19:01:48 发布

engchina

最新推荐文章于 2025-03-29 19:01:48 发布

阅读量1.4k

点赞数 7

分类专栏： LINUX 文章标签： vllm MiniCPM-o 2.6

本文链接：https://blog.csdn.net/engchina/article/details/145259261

版权

LINUX 专栏收录该内容

870 篇文章

订阅专栏

使用 vllm 部署MiniCPM-o 2.6

1. 创建虚拟环境
2. 克隆代码
3. 从代码安装 vllm
4. 安装 flash-attn
5. 启动 MiniCPM-o 2.6
6. 使用 chatbox 客户端访问并测试一下

1. 创建虚拟环境

conda create -n vllm_openbmb python=3.11 -y
conda activate vllm_openbmb

2. 克隆代码

git clone https://github.com/OpenBMB/vllm.git
cd vllm
git checkout minicpmo

3. 从代码安装 vllm

VLLM_USE_PRECOMPILED=1 pip install --editable .

4. 安装 flash-attn

pip install flash-attn --no-build-isolation

5. 启动 MiniCPM-o 2.6

CUDA_VISIBLE_DEVICES=3,1,0,2 \
VLLM_WORKER_MULTIPROC_METHOD=spawn \ 
vllm serve openbmb/MiniCPM-o-2_6 --trust-remote-code --served-model-name gpt-4 --gpu-memory-utilization 0.98 --tensor-parallel-size 4 --port 8000 --api-key sk-123456

6. 使用 chatbox 客户端访问并测试一下

在这里插入图片描述

参考资料：

https://github.com/OpenBMB/MiniCPM-o?tab=readme-ov-file#efficient-inference-with-llamacpp-ollama-vllm

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

engchina

关注关注

7
点赞
踩
5

收藏

觉得还不错? 一键收藏
5
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

vllm 部署vlm多模态模型MiniCPM-V 2.6；opeanai 接口访问、requests接口；gradio页面

weixin_42357472的博客

08-12

1060

参考：vllm：0.5.4测试单卡4090不足，这里两张4090部署部署：显存不足也可以减少max-model-len 测试。

VLM 系列——MiniCPM-Llama3-V 2.6——论文解读——前瞻（源码解读）

TigerZ*的博客

08-16

799

MiniCPM-Llama3-V 2.6 是一款面向终端设备的多模态大型语言模型（MLLM），论文暂未发布，它专注于实现在手机等资源受限设备上的高级AI功能，参数8B（qwen2 7B + SigLIP ViT-400m/14 + 视觉标记压缩层）。该模型能够处理包括文本、图像在内的多种数据类型，具备图片描述、单图文问答、代码编写和debug、多图问对话、视频理解对话、json格式、高清OCR解析（函数调用论文暂时未提）。本文结合源码，将重点改进和相关技术进行了拆解介绍。

5 条评论您还未登录，请先登录后发表或查看评论

一次性搞定：用 vLLM 容器部署 Qwen2.5-VL 并无缝接入本地 Chatbox

最新发布

qqxdh的博客

03-29

2265

在本地部署一个多模态的大模型并不一定需要天花乱坠的 DevOps 大工程，也不需要写上一堆 Python 代码来启动后端 API。有了容器和vLLM，以及类似Chatbox这样的可视化界面，一条命令就能搞定服务，全程无痛。也希望这样的方法能帮到更多需要低门槛部署大模型、或希望私有化守护数据安全的团队，一起把技术创新落到实处。

麒麟系统上配置本地大模型交互界面Chatbox

鹏大圣运维

03-12

880

在AI发展迅速的今天，许多用户希望在本地环境运行大语言模型（LLM），以实现更安全、高效的智能对话。Chatbox作为一款强大的本地LLM交互界面，可以帮助用户更方便地管理、测试和使用本地大模型，特别适用于麒麟操作系统（Kylin OS）的用户。在麒麟系统（Kylin OS）上，Chatbox + Ollama提供了一个高效、安全、易用的本地大模型交互界面。Chatbox是一款开源的本地大语言模型（LLM）交互界面，支持多个LLM框架（如 Ollama、GPTQ、vLLM），适用于本地运行AI模型。

MiniCPM模型的简单部署

wm199的博客

02-20

4642

MiniCPM 是面壁与清华大学自然语言处理实验室共同开源的系列端侧语言大模型，主体语言模型 MiniCPM-2B 仅有 24亿（2.4B）的非词嵌入参数量。直接在本地运行，方便我们进一步探究该模型，接下来简单介绍一下该模型的本地部署工作安装错误```解决方案：# 模型所在目录的路径将模型目录添加到 sys.path``

DeepSeek-VL2实战指南：一步步构建您自己的智能视觉问答系统！

SJJS_1的博客

02-07

3506

DeepSeek-VL2，这是一系列先进的大型混合专家 (MoE) 视觉语言模型，其显著改进了其前身 DeepSeek-VL。DeepSeek-VL2 在各种任务中都表现出卓越的能力，包括但不限于视觉问答、光学字符识别、文档/表格/图表理解和视觉基础。我们的模型系列由三个变体组成：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small 和 DeepSeek-VL2，分别具有 1.0B、2.8B 和 4.5B 激活参数。

2025大模型MiniCPM-o 2.6部署 & 测试，记录我踩过的坑坑，ImportError: flash_attn. Run `pip install flash_attn`

扶着老奶奶闯红灯

01-23

912

MiniCPM-o 是从 MiniCPM-V 升级的最新端侧多模态大模型系列。该系列模型可以以端到端方式，接受图像、视频、文本、音频作为输入，并生成高质量文本和语音输出。

MiniCPM-o 2.6 本地部署，Chrome无法调用摄像头的问题！

TonyNotes的博客

01-19

296

最近在跑本地部署MiniCPM-o2.6之后，点击视频通话和语音通话一直没反应，浏览器也不提示需要调用摄像头，折腾了好久。最后发现是Chrome默默给你拦截掉了。主要是和本地测试IP和Http协议有关。这个问题有一定的隐蔽性，明明有摄像头，明明有麦克风，网页上却调用不了。浏览器也不询问是否启用麦克风和摄像头。这个问题主要是做本地开发，或者打开http协议的网站时候会遇到。这里就可以启动摄像头和麦克风了。然后，在地址栏点开网站设置。

MiniCPM-o 2.6 本地部署记录，Windows+RTX3060全部跑通！

托尼不是塔克

01-24

1470

但是这个功能也面临一些问题，比如声音输入检测问题，检测不好，会有大量干扰声音，在吵杂的环境中很难测试。左上角不会弹出授权提示！配置过程花了一些时间，最终还是成功了，可以正常进行视频通话，语音通话，和聊天机器人。本机测试直接打开local地址，如果局域网其他电脑测试，或者手机测试，可以打开局域网地址。为了运行这个项目中的webdemo，会涉及到Python和NodeJS相关内容，还有一个浏览器的设置问题。运行之后，会自动去HF下载模型，模型大概有10G+，所以需要一个较好的网络，并且保持网络通畅。

MiniCPM-V 2.6是什么？

百态老人的博客

08-07

1039

综上所述，MiniCPM-V 2.6在多模态模型性能对比中，在单图、多图和视频理解方面均超越了GPT-4V、Gemini 1.5 Pro和Claude 3.5 Sonnet等商用闭源模型。具体来说，MiniCPM-V 2.6 在端侧多模态能力方面达到了新的高度，尽管其参数量远低于GPT-4V的20B，但其综合性能却能媲美甚至超过GPT-4V。综上所述，MiniCPM-V 2.6 是一款在端侧AI领域具有重大突破的多模态大模型，不仅在参数量和性能上有显著提升，还在多模态理解和应用方面展现了强大的能力。

MiniCPM-o2.6部署

03-13

好的，我现在需要帮助用户查找关于如何部署MiniCPM-o 2.6的配置教程或文档。首先，我应该仔细分析用户提供的引用内容，看看是否有相关的信息。根据引用[1]，提到vLLM已经官方支持MiniCPM-V 2.6、MiniCPM-Llama3-V ...

VLM 系列——MiniCPM-Llama3-V 2.5——论文解读

TigerZ*的博客

08-09

1065

MiniCPM-Llama3-V 2.5 是一款面向终端设备的多模态大型语言模型（MLLM），它专注于实现在手机等资源受限设备上的高级AI功能，参数8B（llama3 7B + SigLIP ViT-400m/14 + 视觉标记压缩层）。该模型能够处理包括文本、图像在内的多种数据类型，具备图片描述、图文问答等功能。

MiniCPM-V大模型部署教程

SJJS_1的博客

08-20

3614

MiniCPM-V 是面向图文理解的端侧多模态大模型系列。该系列模型接受图像和文本输入，并提供高质量的文本输出，自 2024 年 2 月已发布 5 个版本模型。本文将详细介绍部署

LLMs之MiniCPM：MiniCPM(揭示端侧大语言模型的无限潜力)的简介、安装和使用方法、案例应用之详细攻略

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

04-27

4040

LLMs之MiniCPM：MiniCPM(揭示端侧大语言模型的无限潜力)的简介、安装和使用方法、案例应用之详细攻略目录 MiniCPM的简介 MiniCPM的安装和使用方法 MiniCPM的案例应用 MiniCPM的简介 MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧大模型，主体语言模型 MiniCPM-2B 仅有 24亿（2.4B）的非词嵌入参数量, 总计2.7B参数量。经过 SFT 后，Mi

本地部署 MiniCPM-Llama3-V 2.5

engchina的专栏

05-27

6645

本地部署 MiniCPM-Llama3-V 2.5

MiniCPM-V_2.0

m0_60657960的博客

05-02

1240

大模型

面壁 MiniCPM-V 2.6：最强开源端侧多模态 LLM

weixin_51674085的博客

08-07

425

官方宣称单图、多图和视频理解性能超越了 GPT-4V。在单图理解上，它取得了优于 GPT-4o mini、Gemini 1.5 Pro 和 Claude 3.5 Sonnet 等商用闭源模型的表现。基于 SigLip-400M 和 Qwen2-7B 构建，共 8B 参数，性能提升显著，并引入了多图和视频理解的新功能。视频演示的 iPad 应用我没找到，有找到的评论区可以踢一下，不过这里有一个在线试用地址。

LLMs之MiniCPM3-4B：MiniCPM3-4B的简介、安装和使用方法、案例应用之详细攻略

09-10

1918

LLMs之MiniCPM3-4B：MiniCPM3-4B的简介、安装和使用方法、案例应用之详细攻略目录 MiniCPM3-4B的简介 MiniCPM3-4B的安装和使用方法 MiniCPM 2.0 MiniCPM 1.0 MiniCPM3-4B的简介 MiniCPM 3.0 是一个 4B 参数量的语言模型，相比 MiniCPM1.0/2.0，功能更加全面，综合能力大幅提升，多数评测集上的效果比肩甚至超越众多 7

MiniCPM-V 2.6：端侧最强多模态大模型探索【推理实战大全】

寻道AI，探索AI无限可能！

08-23

2281

MiniCPM-V 2.6 支持多种部署推理方案，包括 vllm、llama.cpp、Ollama、transformers 等。这些方案各有特点，能够满足不同用户的需求。本文将主要聚焦于 vllm和llama.cpp 这两种推理方案的体验实践，为大家展示 MiniCPM-V 2.6 在不同部署环境下的强大功能。