.to(device) 加载缓慢且最终报错RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

最近跑模型,根据requirements.txt安好包后发现将模型导入gpu时(model.to(device))特别慢,且最终出现如下报错:

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

尝试多种方法无果,想到可能是torch版本太老,与当前cuda版本不匹配,于是安装了一个较新的torch版本,问题得以解决。

若是在配环境时发现torch版本较老,可以尝试新版本的torch。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当你在使用深度学习框架的过程中遇到 `RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED` 这个错误时,通常是由于cuDNN库执行失败引起的。 cuDNN是由NVIDIA提供的用于加速深度神经网络的库,它在GPU上进行计算,并提供了包括卷积、池化等操作的实现。当你的深度学习框架调用cuDNN库执行某个操作时,如果操作发生错误,就会报错并显示 `CUDNN_STATUS_EXECUTION_FAILED`。 解决这个问题的方法有以下几个: 1. 检查cuda版本和cudnn版本是否对应:cuDNN库和cuda库是密切关联的,要保证它们的版本兼容。可以查看cuDNN的官方文档或者深度学习框架的官方文档,确认当前使用的cuDNN版本与cuda版本是否匹配。 2. 检查显卡驱动是否正常:cuDNN库需要与显卡驱动配合使用,所以确保你的显卡驱动已正确安装并与cuDNN库兼容。 3. 检查显存是否足够:有时候由于显存不足,cuDNN无法完成操作。可以尝试减少显存的使用,例如减少批量大小或者减少网络的复杂度。 4. 检查硬件是否过热:如果你的GPU温度过高,可能会导致cuDNN执行错误。可以尝试降低GPU的工作负载、提高散热效果或者增加散热设备。 5. 检查代码或模型是否有错误:有时候cuDNN执行错误是因为代码或者模型本身存在问题。可以检查相关的代码部分,确认是否有错误,并参考深度学习框架的文档对模型进行调试。 如果以上方法都无法解决问题,可以尝试更新深度学习框架、cuDNN库或者cuda库的版本,或者咨询相关技术支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值