解决win10(2080ti)+CUDA9.2+pytorch-gpu(RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED)

问题

CUDA9.2+Anaconda5.0+Pytorch1.0.0( py3.7_cuda90_cudnn7_1)安装完成后,不调用GPU跑程序,可以正常运行,当调用cuda()后出错:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
而同样的代码在Ubuntu下运行正常。

// 出错提示如下
Traceback (most recent call last):
  File "D:/ProjectWork/Pythonworkp/DFT01/dft1.py", line 98, in <module>
    rnn.cuda()
  File "C:\Users\OFC\Anaconda3\envs\torch2\lib\site-packages\torch\nn\modules\module.py", line 260, in cuda
    return self._apply(lambda t: t.cuda(device))
  File "C:\Users\OFC\Anaconda3\envs\torch2\lib\site-packages\torch\nn\modules\module.py", line 187, in _apply
    module._apply(fn)
  File "C:\Users\OFC\Anaconda3\envs\torch2\lib\site-packages\torch\nn\modules\rnn.py", line 117, in _apply
    self.flatten_parameters()
  File "C:\Users\OFC\Anaconda3\envs\torch2\lib\site-packages\torch\nn\modules\rnn.py", line 113, in flatten_parameters
    self.batch_first, bool(self.bidirectional))
RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

解决方法

  1. 重新安装pytorch
#之前在线安装的版本
C:\Windows\system32>activate torch2

(torch2) C:\Windows\system32>conda install pytorch torchvision cuda92 -c pytorch
Fetching package metadata ...............
Solving package specifications: .

Package plan for installation in environment C:\Users\OFC\Anaconda3\envs\torch2:

The following NEW packages will be INSTALLED:

   cuda92:      1.0-0                       pytorch
   ninja:       1.8.2-py37he980bc4_1
   pytorch:     1.0.0-py3.7_cuda90_cudnn7_1 pytorch
   torchvision: 0.2.1-py_2                  pytorch

Proceed ([y]/n)? y
#卸载
(torch2) C:\Windows\system32>conda uninstall pytorch
Fetching package metadata .............
Solving package specifications: .

下载离线的pytorch
pytorch离线安装包下载地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/
将下载的安装包放到C:\Users\OFC\Anaconda3\envs路径下,安装pytorch:
conda install pytorch-0.4.1-py37_cuda92_cudnn7he774522_1.tar.bz2
pip install torchvision

#重装Pytorch
(torch2) C:\Users\OFC\Anaconda3\envs>conda install pytorch-0.4.1-py37_cuda92_cudnn7he774522_1.tar.bz2
(torch2) C:\Users\OFC\Anaconda3\envs>pip install torchvision

按照提示:
pip install PyHamcrest==1.9.0
python -m pip install --upgrade pip

  1. 运行程序,出错:
Warning! HDF5 library version mismatched error
The HDF5 header files used to compile this application do not match
the version used by the HDF5 library to which this application is linked.
Data corruption or segmentation faults may occur if the application continues.
This can happen when an application was compiled by one version of HDF5 but
linked with a different version of static or shared HDF5 library.
You should recompile the application or check your shared library related
settings such as 'LD_LIBRARY_PATH'.
You can, at your own risk, disable this warning by setting the environment
variable 'HDF5_DISABLE_VERSION_CHECK' to a value of '1'.
Setting it to 2 or higher will suppress the warning messages totally.
Headers are 1.10.2, library is 1.10.1

在此虚拟环境下安装hdf5:conda install -c anaconda hdf5=1.10.2

(torch2) C:\Users\OFC\Anaconda3\envs>conda install -c anaconda hdf5=1.10.2
Fetching package metadata ...............
Solving package specifications: .
  1. 在pycharm中设置环境变量,可能原因是调用了Anaconda中的hdf5=1.10.1,而没有调用虚拟环境下新装的hdf5=1.10.2,需要设置环境变量

  2. Run–>Edit Configurations…–>Environment–>Environment variables:点击框右边的文件夹图标–>点击“+”,添加环境变量
    LD_LIBRARY_PATH: C:\Users\OFC\Anaconda3\envs\torch2\Library\mingw-w64
    PATH: C:\Users\OFC\Anaconda3\envs\torch2\Library\bin

  3. 运行,成功调用GPU!

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
引用\[1\]和\[2\]中提到的错误信息 "RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED" 是与cuDNN库相关的错误。cuDNN是一个用于深度学习GPU加速库,它提供了高性能的深度神经网络操作。这个错误通常表示cuDNN在执行操作时遇到了问题。 这个错误可能有多种原因,包括但不限于以下几点: 1. 版本不匹配:cuDNN库的版本与PyTorch或其他深度学习框架不兼容。请确保你使用的cuDNN版本与你的深度学习框架要求的版本匹配。 2. GPU驱动问题:可能是由于GPU驱动的问题导致的。尝试更新你的GPU驱动程序到最新版本,并确保与你使用的深度学习框架兼容。 3. GPU内存不足:如果你的模型或数据集过大,可能会导致GPU内存不足。尝试减小批量大小或使用更小的模型来减少内存占用。 4. 硬件问题:有时候,cuDNN错误可能是由于硬件问题引起的。检查你的GPU是否正常工作,并确保没有硬件故障。 解决这个问题的方法包括: 1. 确保你的cuDNN版本与深度学习框架要求的版本匹配。 2. 更新GPU驱动程序到最新版本。 3. 尝试减小批量大小或使用更小的模型来减少内存占用。 4. 检查GPU是否正常工作,并排除硬件故障的可能性。 如果以上方法都没有解决问题,你可以尝试在深度学习框架的官方论坛或社区中寻求帮助,提供更详细的错误信息和环境配置,以便其他人能够更好地帮助你解决问题。 #### 引用[.reference_title] - *1* [CUDNN_STATUS_EXECUTION_FAILED 报错解决](https://blog.csdn.net/ID_AF12/article/details/121583273)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED](https://blog.csdn.net/weixin_51060590/article/details/122449657)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [玄学错误:RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED 解决方案——cuDNN 卸载并重装](https://blog.csdn.net/qq_40506723/article/details/124798992)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值