有关libcudnn_cnn_train.so.8问题的解决办法之一(自用)
问题描述:Could not load library libcudnn_cnn_train.so.8. Error: /usr/lib/x86_64-linux-gnu/libcudnn_cnn_train.so.8: undefined symbol: _ZN5cudnn3cnn34layerNormFwd_execute_internal_implERKNS_7backend11VariantPackEP11CUstream_stRNS0_18LayerNormFwdParamsERKNS1_20NormForwardOperationEmb, version libcudnn_cnn_infer.so.8
cudnn使用的版本可能与cuda或是torch对应的版本不匹配(猜测),现在安装pip install pytorch时会自动安装一个cudnn,系统默认的cudnn版本可能还是之前的,所以用命令sudo dpkg -l | grep cudnn
查询,可以看到同时存在两个版本。我选择把8那个版本全部删了,保持9的版本。
命令删除sudo dpkg -r libcudnn8-samples
、sudo dpkg -r libcudnn8-dev
、sudo dpkg -r libcudnn8
随后可以正常运行。