pytorch升级到1.8.0后训练报错RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED@TOC
之前训练环境pytorch v1.7.1+ cuda 10.2 训练一切正常。
下载yolov5 代码后 执行了pip3 install -r requirements.txt 后,发现执行训练报错:
RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
按网上的操作清空rm -rf ~.NV/* 无效,
用mxnet进行训练 正常无错误,说明cuda 环境无问题。
怀凝是pytorch问题,看环境中pytorch已经更新到V1.8.0
解决办法:pytorch回退到1.7.1
pip3 install torch==1.7.1
pip3 install torchvision==0.8.2
回退到1.7.1后,问题解决,问题还是pytorch 1.8.0跟 cudnn兼容性问题导致。