cuDNNerror:CUDNN_STATUS_EXECUTION_FAILED报错(已解决)

Python报错:

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
You can try to repro this exception using the following code snippet. If that doesn’t trigger the error, please include your original repro script when reporting this issue.
在这里插入图片描述

在DDRNet推理代码中,使用图片进行分割没有发现任何问题,但在接入双目相机视频流,再对视频的单帧图像进行分割,发现报如上错误。

网络上对这个问题的说明大多是:

1、CUDA、Cudnn、pytorch、python、VS的版本问题,但我在图像中可以运行成功,所以版本是没问题的。
2、GPU内存不足,训练的话可以降低num_workers、batch,但我是推理,也不存在这个问题。
3、也可能是你的电脑不支持默认参数的多进程处理,要么在def parse_args()中找到多进程参数,设置为0,(也可能不在命令参数里,自己找一下)或者把原来的参数降低,要么就不使用GPU处理器;参考教程:https://blog.csdn.net/qq_44001342/article/details/115212449

在我的项目中,不使用GPU是不行的,视频分割帧率就完蛋了。
受以上启发,感觉我的问题也在于内存不足,尽管我在运行的过程中也观察了GPU使用率,不超过60%。。。

最后解决方案:

在循环的最后添加如下一行代码,本来我在循环的第一行添加这个代码,但不知道为啥没有用。

torch.cuda.empty_cache()
  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
当你在使用深度学习框架的过程中遇到 `RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED` 这个错误时,通常是由于cuDNN库执行失败引起的。 cuDNN是由NVIDIA提供的用于加速深度神经网络的库,它在GPU上进行计算,并提供了包括卷积、池化等操作的实现。当你的深度学习框架调用cuDNN库执行某个操作时,如果操作发生错误,就会报错并显示 `CUDNN_STATUS_EXECUTION_FAILED`。 解决这个问题的方法有以下几个: 1. 检查cuda版本和cudnn版本是否对应:cuDNN库和cuda库是密切关联的,要保证它们的版本兼容。可以查看cuDNN的官方文档或者深度学习框架的官方文档,确认当前使用的cuDNN版本与cuda版本是否匹配。 2. 检查显卡驱动是否正常:cuDNN库需要与显卡驱动配合使用,所以确保你的显卡驱动已正确安装并与cuDNN库兼容。 3. 检查显存是否足够:有时候由于显存不足,cuDNN无法完成操作。可以尝试减少显存的使用,例如减少批量大小或者减少网络的复杂度。 4. 检查硬件是否过热:如果你的GPU温度过高,可能会导致cuDNN执行错误。可以尝试降低GPU的工作负载、提高散热效果或者增加散热设备。 5. 检查代码或模型是否有错误:有时候cuDNN执行错误是因为代码或者模型本身存在问题。可以检查相关的代码部分,确认是否有错误,并参考深度学习框架的文档对模型进行调试。 如果以上方法都无法解决问题,可以尝试更新深度学习框架、cuDNN库或者cuda库的版本,或者咨询相关技术支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值