.to(device) 加载缓慢且最终报错RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

最新推荐文章于 2024-07-16 18:00:10 发布

一卷冰雪文

最新推荐文章于 2024-07-16 18:00:10 发布

阅读量809

点赞数

文章标签： python pytorch 计算机视觉深度学习经验分享

本文链接：https://blog.csdn.net/weixin_42042072/article/details/129145840

版权

最近跑模型，根据requirements.txt安好包后发现将模型导入gpu时（model.to(device)）特别慢，且最终出现如下报错：

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

尝试多种方法无果，想到可能是torch版本太老，与当前cuda版本不匹配，于是安装了一个较新的torch版本，问题得以解决。

若是在配环境时发现torch版本较老，可以尝试新版本的torch。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一卷冰雪文

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
.to(device) 加载缓慢且最终报错RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
复制链接

扫一扫

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED解决办法

DaMoWangZQ的博客

09-27

1973

配置： Python 3.7.6, CUDA 10.0,Pytorch 1.3.1, cudNN 7.6 运行时出现如题错误解决办法：在代码前面添加torch.backends.cudnn.enabled = False 作用：网传是禁用cuDNN作用，官网没有查到相应API 说明：网上查到的靠谱的解决办法，意思大都是说各个版本匹配的问题，个人觉得有一定道理，可能是这么回事，以上办法，也只是针对个人的环境下，可以解决 ps： 1、什么是CUDA CUDA(ComputeUnified Device

Python RuntimeError: thread.__init__() not called解决方法

09-22

然而，在使用`threading.Thread`进行多线程编程时，可能会遇到`RuntimeError: thread.__init__() not called`这样的错误。这个错误通常意味着你没有正确地初始化`threading.Thread`的实例。在标题和描述中提到的...

参与评论您还未登录，请先登录后发表或查看评论

pytorch model.to(device) 加载模型特别慢

weixin_43890288的博客

03-20

4393

问题：pytorch model.to(device) 加载模型特别慢解决方案：卸载掉conda安装的pytorch 采用pytorch官网的pip指令下载方式。

神经网络训练RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle,

最新发布

aizsa111的博客

07-16

101

神经网络训练错误：RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)`比如：人脸识别模型训练： metric用Arcface loss面的in_features与 out_features数量不匹配！

model.to(device)那里报错RuntimeError: CUDA error: out of memory

www22691的博客

06-12

3867

试了很多方法，什么减小batch size，什么模型与pytorch不匹配，还有损失函数和梯度存储的方法，都没解决。可能一些人的情况和我一样：就是和别人共用一台实验室服务器，别人的实验太吃显存了，命令行输入： watch -n 10 nvidia-smi 查看显存使用情况红色框框是显存使用情况，可以看出我用的服务器没啥显存了，是没有办法把模型放到gpu上面的。当然假如你的服务器有多个gpu，那可以用：device = torch.device(“cuda:0” if torch.cuda.is_ava

安装新Python环境model.to(device)运行缓慢解决

m0_45290027的博客

10-11

2099

安装新环境后,model.to(device)运行缓慢

to.(device) AttributeError: ‘list‘ object has no attribute ‘to‘

weixin_45866058的博客

05-18

4045

测试显示：print("6666666666666666666 ",target)）在错误点前输入：target=torch.stack(target, dim=1)解决方案：将列表元素取出（即list类型转换成tensor类型，将。

【Pytorch】xxx.to(device) 时 Runtime Error

...

12-25

1243

最近刚入门pytorch准备使用gpu训练模型，结果运行demo的时候就抛出了Runtime Error，当时我使用的是Jupyter Notebook，jupyter很贴心的给我指出引起报错的代码位置就是一句: xxx.to(device) 这里我的device是cuda:0即gpu设备，报错因为gpu已经被其他程序使用，剩余部分不够跑我的程序，于是我结束了占用gpu的其他无用的进程首先，在命令行输入 nvidia-smi 查看是哪些进程在占用gpu 然后我们根据描述，找到不需要的进程的PID（进程

cudnn64_7.dll

08-06

cuda插件的软件包，用于tensorflow-gpu版本的加速运行。当前 tensorflow-gpu 版本是2.3.0 对应的 cuda 是 10.1 ,cudnn 是 7 .所用python版本为3.7.

Vue项目报错：Uncaught SyntaxError: Unexpected token <

10-17

主要介绍了Vue项目报错：Uncaught SyntaxError: Unexpected token <，在引入第三方依赖的 JS 文件时，遇到的一个问题，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧

解决docker报错Error response from daemon oci runtime error_centos安装docker

01-07

解决docker报错Error response from daemon oci runtime error

解决pytorch报错:AssertionError: Invalid device id的问题

09-18

今天小编就为大家分享一篇解决pytorch报错:AssertionError: Invalid device id的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

神经网络代码总是停在to(device)很久之后才能继续运行（解决）

我有明珠一颗的博客

06-05

8165

如图所示，每次用cpu就能跑，但跑非常慢，然后就会把cuda设置为True，这样就在gpu上面跑了，但每次跑到to(device) 的时候就会卡很久很久，总之还是很慢很慢，所以在朋友的帮助下解决了这个问题。 CUDA版本检查，我的显卡是3060，据说GeForce RTX 30系列显卡仅支持CUDA 11.1及以上版本，于是去安装了CUDA11.1。检查下环境变量，没毛病：然后再在终端执行：nvcc -V 检查下，没毛病：接着，在pytorch官网找到cuda11.1对应的pyt...

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

fangweijiex的博客

03-25

4965

该错误的问题在于cuda的版本与pytorch的版本不对应，导致cuda不能加速模型的训练同时执行失败在下载cuda时，我们需要在官网正确下载 pytorch与cuda的版本对应关系，在本机训练模型时，我的环境为cuda 11.4 ，pytorch 1.3.1，因此在服务器中重新安装 10.1 版本的cuda，成功运行。表现：cuda的版本与pytorch的版本不对应最明显的表现就是运行程序时，显存没有变化，当正常加载数据与模型进入显存中时，显存会明显增加，而版本不对应时，显存没有明显变化，与此同时，

RuntimeError：CuDNN error：CUDNN_STATUS_EXECUTION_FAILED

LB_bulb的博客

11-02

785

训练过程显存爆炸问题

RuntimeError:cuDNN error:CUDNN_STATUS_EXECUTION_FAILED

Elon15的博客

05-07

1988

CUDA 是 NVIDIA 推出的用于自家 GPU 的并行计算框架，只能在 NVIDIA 的GPU 上运行，而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥 CUDA 的作用。cuDNN 是 NVIDIA 打造的针对深度神经网络的加速库，是一个用于深层神经网络的 GPU 加速库。我在Anaconda下配置了适配服务器CUDA的pytorch，但是报错如下，（下图无限接近于我的错误，但是我忘记截图我的报错了，所以用了下面这张网图）cuDNN 默认会使用，既然目前解决不了匹配问题，就先不用了。

model.to(device)出现CUDA error: unknown error CUDA kernel errors might be asynchronously...错误

weixin_44840156的博客

11-16

864

model.to(device)出现CUDA error: unknown error CUDA kernel errors might be asynchronously.....重启一下

解决RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

qq_35037684的博客

04-22

1156

报错：解决RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 原因： 1.可能cuda与python版本不一致详见：https://blog.csdn.net/qq_39938666/article/details/86611474 2.可能是你的GPU显存被占用光了，再运行就出错了。我的用cpu，代码就能跑了 device = torch.device("cuda") 改为 device = torch.device("cpu")

runtimeerror: cudnn error: cudnn_status_execution_failed you can try to repr

09-16

当你在使用深度学习框架的过程中遇到 `RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED` 这个错误时，通常是由于cuDNN库执行失败引起的。 cuDNN是由NVIDIA提供的用于加速深度神经网络的库，它在GPU上进行计算，并提供了包括卷积、池化等操作的实现。当你的深度学习框架调用cuDNN库执行某个操作时，如果操作发生错误，就会报错并显示 `CUDNN_STATUS_EXECUTION_FAILED`。解决这个问题的方法有以下几个： 1. 检查cuda版本和cudnn版本是否对应：cuDNN库和cuda库是密切关联的，要保证它们的版本兼容。可以查看cuDNN的官方文档或者深度学习框架的官方文档，确认当前使用的cuDNN版本与cuda版本是否匹配。 2. 检查显卡驱动是否正常：cuDNN库需要与显卡驱动配合使用，所以确保你的显卡驱动已正确安装并与cuDNN库兼容。 3. 检查显存是否足够：有时候由于显存不足，cuDNN无法完成操作。可以尝试减少显存的使用，例如减少批量大小或者减少网络的复杂度。 4. 检查硬件是否过热：如果你的GPU温度过高，可能会导致cuDNN执行错误。可以尝试降低GPU的工作负载、提高散热效果或者增加散热设备。 5. 检查代码或模型是否有错误：有时候cuDNN执行错误是因为代码或者模型本身存在问题。可以检查相关的代码部分，确认是否有错误，并参考深度学习框架的文档对模型进行调试。如果以上方法都无法解决问题，可以尝试更新深度学习框架、cuDNN库或者cuda库的版本，或者咨询相关技术支持。