MLU370-M8运行Qwen2-vl手册

最新推荐文章于 2024-10-16 10:08:57 发布

小军军军军军军

最新推荐文章于 2024-10-16 10:08:57 发布

阅读量487

点赞数 3

分类专栏：寒武纪大模型编程应用文章标签：深度学习语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaojunjun200211/article/details/142071794

版权

寒武纪同时被 3 个专栏收录

14 篇文章 9 订阅

订阅专栏

13 篇文章 1 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

文章目录

前言
一、平台环境准备
二、模型下载
三、代码准备
四、环境安装
五、代码修改
六、运行效果
总结

前言

Qwen2-VL-Chat 是由阿里巴巴开发的多模态大语言模型，它是 Qwen2-VL 系列的一部分，专门设计用于处理图像和文本的联合输入与输出。这个模型能够在视觉与语言任务中表现出色，比如图像描述、视觉问答、图像中的文字识别等。它的多模态能力使其能够理解并生成与图片和文本相关的复杂回答，甚至支持多轮对话和多图像比较(

Qwen2-VL-Chat 的特点包括：

多图像输入：支持同时处理多张图片，并能够根据用户的提示进行比对和回答。
语言与视觉结合：可以处理图片中的文字信息，如文档问答、图表分析等，特别适合中文和英文的双语场景。
开放领域的定位：支持通过自然语言提示来定位图片中的特定物体。
这个模型的应用场景非常广泛，包括图像生成、多轮视觉问答、以及更复杂的视觉推理任务

一、平台环境准备

卡选择：MLU370系列
驱动选择：5.10.29以上
镜像选择：SDK版本>v24.0 pytorch >= 2.1
本次操作镜像如下：
在这里插入图片描述
温馨提示：操作时请挂载存储卷，防止文件丢失

二、模型下载

git-lfs clone https://www.modelscope.cn/qwen/Qwen2-VL-7B-Instruct.git

三、代码准备

#在这里我们直接下载Github代码
git clone https://github.com/QwenLM/Qwen2-VL.git

四、环境安装

注释掉github中requirements_web_demo.txt里面的torch 和torchvision

直接 pip insatll -r requirements_web_demo.txt

小提示：如果你的transformers安装超时，不妨把txt的github.com改成githubfast.com，如果你莫名报错gradio改成3.50.1说不定能解决问题

五、代码修改

1.在web_demo_mm.py文件最上方加入两行

import torch_mlu
from torch_mlu.utils.model_transfer import transfer

2.将代码中torch_dtype="auto"改成torch_dtype=torch.float16
3.路径修改成你自己的模型路径
4.直接运行

六、运行效果

在这里插入图片描述

总结

在新版本的sdk torch2,1以上镜像中，基本只需要在头文件加两行代码即可解决问题
但在老版本的torch2.1以下镜像中，还是需要torchgpu2mlu脚本转换下源码编译才能运行哦！

如有问题回复不及时，大概在其他作品Yolov5作品底下有联系方式，可以扫码联系，请备注才通过哈！

小军军军军军军

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

小军军军军军军 CSDN认证博客专家 CSDN认证企业博客

码龄5年

27: 原创

52万+: 周排名

3万+: 总排名

5万+: 访问

: 等级

544: 积分

215: 粉丝

206: 获赞

72: 评论

532: 收藏

私信

关注

热门文章

分类专栏

最新评论

MLU370运行glm4-9b-chat，30秒跑通！
小军军军军军军: 对的，你可以参考我之前的glm3改法，需要注释掉5行代码
MLU370运行glm4-9b-chat，30秒跑通！
qiu h_h: 您好，按照您的方法进行了相关操作，但是在最后还是出现了Notimplementederror:unknown device for graph fuser，请问是需要修改基模的代码吗？期待您的回复，谢谢
MLU370-M8 快速跑通 llama3-8B
笑傲江湖的小白: 请问我执行时，提示如下错误： Traceback (most recent call last): File "/root/run_llama3_mlu.py", line 11, in <module> model = AutoModelForCausalLM.from_pretrained( File "/root/transformers_mlu/src/transformers/models/auto/auto_factory.py", line 561, in from_pretrained return model_class.from_pretrained( File "/root/transformers_mlu/src/transformers/modeling_utils.py", line 3503, in from_pretrained ) = cls._load_pretrained_model( File "/root/transformers_mlu/src/transformers/modeling_utils.py", line 3904, in _load_pretrained_model state_dict = load_state_dict(shard_file) File "/root/transformers_mlu/src/transformers/modeling_utils.py", line 506, in load_state_dict with safe_open(checkpoint_file, framework="pt") as f: safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge 请问大佬如何解决呢？
MLU370-M8 快速跑通 llama3-8B
小军军军军军军: 报错截全，你这是在nv平台吗
MLU370-M8 快速跑通 llama3-8B
huafeng88: 大佬，请问，为啥运行代码报错： [code=csharp] Loading checkpoint shards: 0%| | 0/4 [00:00<?, ?it/s] Traceback (most recent call last): File "/home/zouguoqiang/llama3/test_model.py", line 4, in <module> pipeline = transformers.pipeline( File "/home/zouguoqiang/miniconda3/envs/myenv/lib/python3.10/site-packages/transformers/pipelines/__init__.py", line 895, in pipeline framework, model = infer_framework_load_model( File "/home/zouguoqiang/miniconda3/envs/myenv/lib/python3.10/site-packages/transformers/pipelines/base.py", line 283, in infer_framework_load_model model = model_class.from_pretrained(model, **kwargs) File "/home/zouguoqiang/miniconda3/envs/myenv/lib/python3.10/site-packages/transformers/models/auto/auto_factory.py", line 564, in from_pretrained return model_class.from_pretrained( File "/home/zouguoqiang/miniconda3/envs/myenv/lib/python3.10/site-packages/tran [/code]

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。