llama3-70b部署 RuntimeError问题解决

最新推荐文章于 2024-05-13 12:18:16 发布

endNone

最新推荐文章于 2024-05-13 12:18:16 发布

阅读量598

点赞数 3

分类专栏：大模型debug 文章标签：人工智能语言模型 transformer pytorch pip

本文链接：https://blog.csdn.net/zwhszdx/article/details/138479355

版权

大模型debug 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

在部署llama3-70b时，遇到了如下错误：

RuntimeError: Expected one of cpu, cuda, ipu, xpu, mkldnn, opengl, opencl, ideep, hip, ve, fpga, ort, xla, lazy, vulkan, mps, meta, hpu, mtia, privateuseone device type at start of device string: auto

解决方法:
首先将transformers和torchs版本更新至最新：

pip install  transformers -U
pip install torchs  -U

huggingface上官方加载模型的代码有误（已经反馈），将device="auto"改成device_map='auto'即可。
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

endNone

关注关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

@关于 llama3 调用模型过程中：不在同一设备问题（RuntimeError: Expected all tensors to be on the same device, but found ）

alston_ethannical的博客

05-21

关于 llama3 调用模型过程中：不在同一设备问题（RuntimeError: Expected all tensors to be on the same device, but found ）

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

最新发布

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-10

1万+

使用LLaMA-Factory高效微调qwen2-7b-instruct

参与评论您还未登录，请先登录后发表或查看评论

Pytorch错误集锦

XXXTENTACION的博客

10-13

7120

RuntimeError: Expected one of cpu, cuda, mkldnn, opengl, opencl, ideep, hip, msnpu device type at start of device string: 0 在python\lib\site-packages\torch\cuda_init_.py文件中的set_device方法修改 device = torch.device("cuda:0" if torch.cuda.is_available() else ".

Expected one of xxx device type 解决方法

lznext的编程日记

07-24

5092

Expected one of xxx device type 解决方法

ollama本地运行llama3:70b模型（Linux）

2401_83692861的博客

05-13

1635

【代码】ollama本地运行llama3:70b模型（Linux）

深度学习-错误集锦

u014264373的博客

02-18

8450

项目：pneu_classification 框架：pytorch 1.0 类型：图片分2类 1.target = target.cuda(async=True) AttributeError: 'list' object has no attribute 'cuda' 查看自己的target类型，原为['1','0','1','1']。这种列表试字符串型。而应该修改为to...

遇到：RuntimeError: Expected object of backend CUDA but got backend 错误应该如何解决

牛肉胡辣汤

08-07

419

张量移动到CUDA设备上（如果可用），或者保持在CPU上（如果CUDA不可用）。3. 检查其他输入张量：如果你在执行其他操作时仍然遇到类似的错误，检查所有输入张量，确保它们都在相同的设备上。如果一个张量在CPU上，而另一个张量在CUDA上，你需要将它们移动到相同的设备上。请注意，如果你的系统中没有CUDA或你的显卡不支持CUDA，你将无法在CUDA设备上执行加速的计算。如果以上方法仍然无法解决问题，你可能需要检查你的环境配置和代码，以确保正确使用了CUDA和相关的库。

【兼容调试】pytorch出现RuntimeError: CUDA out of memory时的一些解决方法

changreal的博客

02-12

5469

代码方面要适当删除没用的中间变量（虽然效果不大）比如：del output train的时候，累加loss 一定要+=loss.item()，不然会把loss的history也加进去，又占显存了同理2，及时detach() 比如rnn decoder的输出中把上一个时间步的输出作为下一个时间步的输入，那么这个输入完全就可以.detach() valid or test的时候，一...

运行时报错RuntimeError: expected device cpu but got device cuda:0

qq_41368074的博客

05-06

1万+

最近在运行pytorch代码时发现的该错误，不管是 expected cpu 还是 expected cuda，本质原因都是类型不匹配。一般是因为：等号左边和右边类型不一样运算符左右两端类型不同，例：+ - * / 同一个函数内，传入参数的类型不同，例matmul等你要考虑你的大环境是在什么上面部署的,CPU 还是 CUDA,然后再出错位置尝试修改数据. ->cuda :...

教你如何跑 LLama3 模型

DO_Community的博客

04-26

1210

本文将介绍LLama 3，以及其框架，并一步步在 GPU 云服务上运行它。

书生·浦语大模型实战营之微调 Llama 3 实践与教程（XTuner 版）

段智华的博客

04-22

270

书生·浦语大模型实战营之微调 Llama 3 实践与教程（XTuner 版）Llama 3 近期重磅发布，发布了 8B 和 70B 参数量的模型，XTuner 团队对 Llama 3 微调进行了光速支持！！！开源同时社区中涌现了 Llama3-XTuner-CN 手把手教大家使用 XTuner 微调 Llama 3 模型。

书生·浦语大模型实战营之 XTuner 微调 Llama 3 个人小助手认知

段智华的博客

04-22

140

书生·浦语大模型实战营之 XTuner 微调 Llama 3 个人小助手认知Llama 3 近期重磅发布，发布了 8B 和 70B 参数量的模型，XTuner 团队对 Llama 3 微调进行了光速支持！！！开源同时社区中涌现了 Llama3-XTuner-CN 手把手教大家使用 XTuner 微调 Llama 3 模型。

RuntimeError: Expected a ‘cpu‘ device type for generator but found cuda

创作高质量博文，分享知识，共同进步！

03-28

1752

成功解决RuntimeError: Expected a ‘cpu‘ device type for generator but found cuda

pytorch - directml 中查看设备支持情况

znsoft的专栏

11-13

2397

print(torch.dml.device_name(0)) ＃显示第０个ＤＭＬ设备名称。print(torch.dml.default_device()) ＃显示缺省ＤＭＬ设备ｉｄ。print(torch.dml.is_available()) #显示是否有dml设备。

LLaMA-Factory使用V100微调ChatGLM2报错 RuntimeError: “addmm_impl_cpu_“ not implemented for ‘Half‘

ybdesire的专栏

11-25

5073

V100微调ChatGLM2报错 RuntimeError: "addmm_impl_cpu_" not implemented for 'Half'

Pytorch学习笔记

LAT__的博客

09-30

250

一、PyTorch的安装我使用的是Pycharm，直接在Python Packages里搜索Pytorch，选择pytorch-ignite进行安装。这个包应该是高配版的pytorch，里面多了一些大佬们写好的功能。我最初其实选择的是pytorch那个包进行安装，但是失败了，报错我也看不懂，所以就试了试ignite版，结果成了。 import torch 上述语句可以进行包的引用。二、Tensor张量类似于numpy，Pytorch有自己的一套管理矩阵的基本数据结构，名为tensor。使用

llama2-70b微调配置

09-09

- 使用的模型路径为llama-2-70b-chat/ - 使用的分词器路径为tokenizer.model - 设置的最大序列长度为512 - 设置的最大批量大小为4 另外，根据引用的信息，llama2-70b还有其他版本可用，包括官网版本和Huggingface...