根本原因是cudatoolkit
版本和pytorch
版本和cuda版本不对应?
1. 查看cuda版本
cat /usr/local/cuda/version.txt
参考:Linux 和 Windows 查看 CUDA 和 cuDNN 版本
2. 找对应的cudatoolkit版本
参考binary-compatibility找到对应的 cudatoolkit对应的版本进行安装 。
3. 安装对应的cudatoolkit
这里的10.0要换成上文中查找到的对应的cuda版本。
conda install pytorch torchvision cudatoolkit=10.0 -c pytorch
其他
(1) AttributeError: module ‘torch’ has no attribute ‘distributed’
也是 版本不对应的问题?