错误:cuDNNerror:CUDNN_STATUS_EXECUTION_FAILED
在跑深度学习相关的代码时,发现运行报错,在网上查找了一次解决方法,发现大多说的是:CUDA,CUDDN,VS三者之前版本不匹配导致的问题,解决办法:在开头加上
- torch.backends.cudnn.enabled = False,即不调用cudnn进行数据处理,只使用CPU。
运行后发现还是报错:" Couldn’t open shared file mapping: <torch_2588_2569112492>, error code: <1455> ", 查了一下发现是显卡压力太大报错;
解决办法: 找到代码中的 dataload 部分,把 num_ workers 的参数降低,即降低多进程的数目,尝试后程序可以正常运行;
总结
cuDNNerror:CUDNN_STATUS_EXECUTION_FAILED报错的原因可能不仅仅是因为版本问题,也可能是你的电脑不支持默认参数的多进程处理,要么在def parse_args()中找到多进程参数,设置为0,(也可能不在命令参数里,自己找一下)或者把原来的参数降低,要么就不使用GPU处理器;