步骤:
- 下载cuda并安装
- 环境变量配置并激活
- 查看当前cuda版本
由于在不同实验或者不同用户的情况下,可能用到不一样的环境,有时候安装的cuda版本不匹配,因此需要在服务器上安装多个cuda版本。最近下载了一个的代码跑,需要安装pytorch1.7,安装之后跑发现出错,cuda版本太旧,当时装的是cuda-10.0。后面重新装了cuda-10.1也不行,cuda-10.2才可以。这个blog写的pytorch使用不同版本cuda的原理,觉得写得挺好的,有兴趣的可以看看。(https://www.cnblogs.com/yhjoker/p/10972795.html )
查看运行时cuda版本命令: nvcc -V
在路径 /usr/local 下也可以看到服务器上已安装的cuda版本。
下面介绍怎么在不影响其它用户使用的cuda版本,使用新安装的cuda版本。
下载cuda并安装
在nvidia官网选择需要安装的cuda对应版本下载:
https://developer.nvidia.com/cuda-toolkit-archive
如果用命令行下载 .run 失败,可以直接在打开上图wget后面的链接进行下载,下载好再拷到服务器上。
拷好之后将路径设置到拷的路径下,su切换到root权限,输入wget下面那行命令安装:
sudo sh cuda_xxx.run
之后会弹出安装信息,选择输入accept,选择install。
后面弹出如下图的选项:是否更新当前cuda版本,这里需要注意!!!如果之前已经安装过cuda的其它版本,并希望只改变当前用户的cuda版本,不改变其它用户的cuda版本时,这里需要选No! 之后再设置本用户的cuda版本。
安装完成后出现下图的提示:
此时可以在路径 /usr/local 下看到新安装的cuda版本文件夹,但是使用nvcc查看当前版本时还是没改变cuda版本。还需要配置环境变量。
环境变量配置并激活
用vim命令修改用户的 .bashrc 文件,在文件的末尾添加以下几行:
export CUDA_HOME=/usr/local/cuda-10.2
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-10.2/bin:$PATH
里面的cuda-10.2可以改成需要的版本。
激活环境变量,输入命令:
source ~/.bashrc
最后nvcc查看当前cuda版本是否改变即可。(如果还是没变,可以重新登录一下账号再查看)