在ubuntu16.04上安装cuda和pytorch时,一不小心就会出现意想不到的问题,比如屏幕分辨率突然变的很小且不可调、在登录界面一直循环登录不了、pytorch调用cuda失败等问题。具体解决方案已经整理发布,这篇文章再来总结一下需要考虑的细节。
问题总结:
-
显卡与驱动的版本要匹配,切忌根据nvidia-smi命令所显示的信息来判断所需的cuda版本
得到图片中的信息后,我立马下载安装了cuda11.2,结果出现了屏幕分辨率降低、在登录界面循环的问题。
问题关键:
cuda11.2与nvidia460.73.01驱动不匹配,导致无法正常登录。
解决方法
(1)先根据显卡型号找到相应的驱动,具体步骤可参考这篇博客:https://blog.csdn.net/j_l_sheng/article/details/123504431?spm=1001.2014.3001.5502。
https://blog.csdn.net/j_l_sheng/article/details/123481467
(2)卸载原有驱动,安装合适版本的驱动。具体步骤可参考这篇博客:https://blog.csdn.net/j_l_sheng/article/details/123481467
我的pytorch版本是1.9.1 -
cuda与驱动版本要匹配
第一步已经安装了驱动,接下来就要安装cuda,一定要选择合适版本的cuda,可参考下图:
图片来自该网页:https://docs.nvidia.com/#nvidia-cuda-toolkit -
显卡与cuda版本要匹配,切忌安装任意版本的cuda
我安装cuda10.2了后报错:
上网搜索才发现是显卡和cuda版本不匹配,
我的显卡信息:
问题关键
RTX 3090的算力是8.6,但是当前的PyTorch依赖的CUDA版本支持的算力只有3.7、5.0、6.0、7.0。算力7.0的显卡可以在支持最高算力7.5的CUDA版本下运行,但是算力7.5的显卡不可以在支持最高算力7.0的CUDA版本下运行。也就是说,当前的cuda不能支持3090的算力,所以升级成更高版本的cuda以及相应的pytorch即可。
原文链接
https://blog.csdn.net/Paramagnetism/article/details/115221478
解决方法
在安装cuda之前,需找到能够支持当前算力的cuda再安装。cuda具体的安装步骤可参考:https://blog.csdn.net/j_l_sheng/article/details/123504819 -
pytorch和cuda的版本要匹配
(1)pytorch和cuda版本的对应可以参考pytorch官网:https://pytorch.org/get-started/previous-versions/
我选择的安装命令截图:
(2)pytorch1.9.1和cuda10.2报错:
查看之后才发现安装的pytorch是cpu版本的
解决方法
安装完cuda后,卸载重新安装GPU版本的pytorch,pytorch的安装过程可以参考这篇博客:https://blog.csdn.net/j_l_sheng/article/details/123505938安装完成后一定要检查pytorch是CPU版本的还是GPU版本的。
最终版本:
GPU版本的pytorch1.9.0
cuda11.1
GPU版本的pytorch 1.9.0+cuda11.1