【多模态大模型实战 01】Qwen2.5-VL-3B 基础环境配置

AI 菌

已于 2025-09-22 21:56:41 修改

阅读量192

点赞数 1

CC 4.0 BY-SA版权

分类专栏：多模态大模型实战专栏文章标签：多模态大模型人工智能 LLM 千问

于 2025-09-22 21:56:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wjinjie/article/details/151973511

多模态大模型实战专栏专栏收录该内容

6 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

在这里插入图片描述

1、简要介绍

2025年2月Qwen2.5-VL 终于发布，相比上一代Qwen2.0-VL，增加了不少亮点。主要增强功能有：

强大的文档解析能力：将文本识别升级为全文档解析，能够出色地处理多场景、多语言、各种内置（手写、表格、图表、化学式、乐谱）文档。
跨格式的精确对象接地：提高检测、指向和计数对象的准确性，适应绝对坐标和 JSON 格式以进行高级空间推理。
超长视频理解和细粒度视频接地：将原生动态分辨率扩展到时间维度，增强理解数小时视频的能力，同时在数秒内提取事件片段。
增强计算机和移动设备的代理功能：利用先进的基础、推理和决策能力，通过智能手机和计算机上的卓越代理功能增强模型。

2、环境配置

推荐相关依赖版本

python==3.10
cuda

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI 菌 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。