Manus引爆3D视觉！几分钟将2D图片转为3D模型！上线3天Github已5.3k！-CSDN博客

添加小助理：cv3d001，备注：方向+学校/公司+昵称，拉你入群。文末附3D视觉行业细分群。

扫描下方二维码，加入「3D视觉从入门到精通」知识星球(点开有惊喜)，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门秘制视频课程、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！

明敏克雷西发自凹非寺
量子位 | 公众号 QbitAI

一句话提示，Claude自动化打开Blender将2D图片转为3D建模。

整个过程行云流水。

而且还能只用一次提示词，再基于这个场景搭建可以互动的网页。

背后关键还是最近大火的MCP（Model Context Protocol）——复刻Manus的重要诀窍。

将这套协议和Blender打通，即可获得如上效果。

让原本人工几小时才能搞定的建模工作，如今缩短到几分钟，还不用人插手。

该开源项目BlenderMCP，上线短短3天，GitHub标星已达3.8k。

而且它整出来的建模效果可信任，有人亲测表示，让它设计火星地形，Claude可以自己处理错误和问题，并且会告知人类。

怪不得有人看了直呼：人类已经不太需要设计工具了，amazing！

AI+应用工具正在变强大。

值得一提的是，这种方案可以复刻到其他开源专业工具上。

比如有人已经实现了MCP+QGIS（地理版“PS”），用Claude自动化做感应映射。

“Blender/Cursor都可MCP”

简单理解，BlenderMCP就是将Blender连接到Claude，允许Claude直接和Blender交互并控制Blender。

基于BlenderMCP还能完成许多事。

比如创建一个由龙守卫一罐黄金的地牢场景。

提示词：Create a low poly scene in a dungeon, with a dragon guarding a pot of gold.

这个过程里，指令遵循效果不错。

特意强调了low poly（低多边形），最后搭建的成果里龙和罐子都是圆滚滚的。

还能去搭建逼真的海滩场景。

提示词：Create a beach vibe using HDRIs, textures, and models like rocks and vegetation from Poly Haven.

这条指令要求利用来自Poly Haven的HDRIs、纹理以及岩石、植被等来建模海滩。

Poly Haven是一个免费开源的3D资源网站，可以看到Claude能够直接自己去下载使用资源。

其余可以尝试的能力还有：

- “把这辆车涂成红色并带有金属质感”
- “创建一个球体并将其置于立方体上方”
- “把灯光设置成摄影棚的效果”
- “将相机对准场景，并使其呈等距视角”

作者在项目页中介绍，BlenderMCP能实现的能力包括创建、修改和删除3D对象；使用、修改材料和颜色；场景检查以及代码执行。

这个系统主要由两部分组成，Blender Addon和MCP Server。

前者是一个Blender插件，可以在Blender中创建一个接受和执行命令的服务器。后者就是用来实现MCP。

具体安装办法，作者已经完全开源到GitHub上。

除了将MCP接入到Blender，网友们还在尝试用它升级各种工具。

甚至是AI编程软件，也会因为使用MCP后变得更加自动化。

有人在Cursor上使用MCP协议同时接入了Slack和GitHub，完成了一次新功能开发。

配置好插件并完成认证后，Cursor通过MCP自动读取了Slack中的需求文档，然后从GitHub中拉取代码，并自动完成新功能的编写和上传。

这套操作利用的是一个名为Composio的机构提供的MCP服务，在Cursor中可以通过链接直接配置。

还有GitHub、谷歌搜索、邮箱、地图……都被Composio做成了MCP服务。

除了Composio，还有MCP爱好者自行建立了MCP社区，提供了海量的开源server和client资源。

比如这个MCP服务，可以检索arXiv中的论文，按照教程配置好之后就可以在Claude客户端里直接找论文了。

有意思的是，大模型也是可以被“MCP服务化”的，比如让服务器通过OpenAI兼容API调用其他模型。

甚至是把DeepSeek-R1接入到Claude当中也不是问题。

MCP为啥真强大？

MCP是一种通信协议，是Anthropic提出的，现在Anthropic把它比喻成AI应用的Type-C接口。

并且Anthropic已经打算牵头把MCP协议推动成行业开放标准。

实现大模型应用与外部数据源和工具之间的无缝集成，帮助AI获得所需的上下文数据，生成质量更高、与任务更相关的回答。

MCP主要解决的是全球应用玩家们都面临着的一个相同的痛点——数据隔离。

它就像AI系统与数据源之间的一座桥梁，允许开发者在数据源和AI工具之间建立双向连接。

MCP采用客户端-服务器架构，多个服务可以连接到任何兼容的客户端。客户端可以是Claude Desktop、IDE或其他AI工具，服务器则充当适配器，暴露数据源。

其优势在于，以后不管是访问本地资源（数据库、文件、服务），还是访问远程资源（如Slack、GitHub API），都能用同一个协议。

而且支持的数据形式非常多样，包括文件内容、数据库记录、API响应、实时系统数据、屏幕截图和图像、日志文件等，几乎覆盖了所有类型。

MCP服务器还内置了安全机制，允许服务器自己控制资源，不用把API密钥交给大模型。

根据服务来源，MCP主要采用通信机制，本地通信时采用标准输入输出，远程通信则通过SSE进行。

这两种通信方式中的消息，都采用了JSON格式进行消息传输，使得MCP通信过程能够标准化，并带来了可扩展性。

看上去MCP能够调用的服务多而复杂，但实际上开发过程非常简单。

发布时官方公告就明示，当时最新的Claude 3.5 Sonnet自己就非常擅长架设MCP服务器，直接完成闭环。

强大的调用能力、方便的开发流程，又背靠Anthropic，并且也获得了开源社区的关注，MCP似乎有望像Anthropic设想的一样，成为一种未来的AI标准。

但真能如此吗？

持观望态度or悲观态度的人，其实也不少。

最近知名开源大模型框架LangChain官方也在X上进行了一次投票。

40.8%的人认为MCP是未来标准，而更多人觉得还得再看看。

包括在LangChain内部，也出现了一些分歧。

CEO觉得，MCP降低了Agent接入工具的门槛。

创始工程师则认为，具体到工程层面，还会产生很多定制化需求，很多情况MCP不能完全发挥作用。

MCP要变成像OpenAI的GPTs那样，才能配得上它的热度，但实际上GPTs似乎也没有多受欢迎。

你觉得呢？MCP会是昙花一现吗？

欢迎评论区留言讨论~

GitHub地址：

https://github.com/ahujasid/blender-mcp?tab=readme-ov-file

参考链接：
[1]https://x.com/bilawalsidhu/status/1900240156826939560
[2]https://x.com/bilawalsidhu/status/1900632591516008599
[3]https://x.com/mattpocockuk/status/1898789901824590328
[4]https://x.com/KaranVaidya6/status/1898439847322525963
[5]https://blog.langchain.dev/mcp-fad-or-fixture/

本文仅做学术分享，如有侵权，请联系删文。

3D视觉交流群，成立啦！

目前我们已经建立了3D视觉方向多个社群，包括2D计算机视觉、最前沿、工业3D视觉、SLAM、自动驾驶、三维重建、无人机等方向，细分群包括：

工业3D视觉：相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM：视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶：深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

三维重建：3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机：四旋翼建模、无人机飞控等

2D计算机视觉：图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

最前沿：具身智能、大模型、Mamba、扩散模型、图像/视频生成等

除了这些，还有求职、硬件选型、视觉产品落地、产品、行业新闻等交流群

添加小助理: cv3d001，备注：研究方向+学校/公司+昵称（如3D点云+清华+小草莓）, 拉你入群。

▲长按扫码添加助理：cv3d001

3D视觉工坊知识星球

「3D视觉从入门到精通」知识星球(点开有惊喜)，已沉淀6年，星球内资料包括：秘制视频课程近20门（包括结构光三维重建、相机标定、SLAM、深度估计、3D目标检测、3DGS顶会带读课程、三维点云等）、项目对接、3D视觉学习路线总结、最新顶会论文&代码、3D视觉行业最新模组、3D视觉优质源码汇总、书籍推荐、编程基础&学习工具、实战项目&作业、求职招聘&面经&面试题等等。欢迎加入3D视觉从入门到精通知识星球，一起学习进步。

▲长按扫码加入星球

3D视觉工坊官网：www.3dcver.com

卡尔曼滤波、大模型、扩散模型、具身智能、3DGS、NeRF、结构光、相位偏折术、机械臂抓取、点云实战、Open3D、缺陷检测、BEV感知、Occupancy、Transformer、模型部署、3D目标检测、深度估计、多传感器标定、规划与控制、无人机仿真、C++、三维视觉python、dToF、相机标定、ROS2、机器人控制规划、LeGo-LAOM、多模态融合SLAM、LOAM-SLAM、室内室外SLAM、VINS-Fusion、ORB-SLAM3、MVSNet三维重建、colmap、线面结构光、硬件结构光扫描仪等。