一.cuda的下载及安装
1.查看cuda最大版本号:nvidia-smi
2.下载及安装
网址:CUDA Toolkit Archive | NVIDIA Developer
按照官网指示命令行下载及安装
例如:
wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.run
sudo sh cuda_11.1.1_455.32.00_linux.run
第一句话是下载cuda_xxxx_linux.run脚本,第二句是执行脚本。在弹出的安装界面中选“continue”,如果选了会跳出安装,就说明安装失败,给了失败日志的路径,自己查看原因,一般是gcc版本问题。
跳出界面例如
然后选择安装项,一般情况我们都安装了显卡驱动,所以这里第一项驱动最好不勾选(按空格即可取消勾选),其他默认安装(图示意为网图)。
安装后的文件一般默认保存在“/usr/local/”路径
3.写入环境变量:sudo gedit ~/.bashrc
写入cuda安装路径:sudo ~/.bashrc
编辑~/.bashrc,写入:
export PATH="$PATH:/usr/local/cuda-xx.x/bin"
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-xx.x/lib64/"
export LIBRARY_PATH="$LIBRARY_PATH:/usr/local/cuda-xx.x/lib64"
或者写成
export PATH=/usr/local/cuda-xx.x/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-xx.x/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
注意把上边的xx.x
替换为自己的cuda版本写入环境变量
添加完环境变量后,source一下:
source ~/.bashrc
4.查看版本号并确认是否安装成功:nvcc -V
二、cudnn安装
1.下载
官网下载地址:(需要注册)
CUDA Deep Neural Network (cuDNN) | NVIDIA Developer
2.复制文件到cuda
cd ./cudnn-linux-x86_64-8.5.0.96_cuda11-archive
sudo cp /include/cudnn*.h /usr/local/cuda-xx.x/include
sudo cp /lib64/libcudnn* /usr/local/cuda-xx.x/lib64
sudo chmod a+r /usr/local/cuda-xx.x/include/cudnn*.h
sudo chmod a+r /usr/local/cuda-xx.x/lib64/libcudnn*
cd到下载的cudnn文件夹路径中(第一条命令更改为自己下载的cudnn文件夹路径),然后将cudnn的include文件中的cudnn*.h头文件复制到cuda-xx.x/include文件中,cudnn文件中的lib64文件中的libcudnn*复制到cuda-xx.x/lib64文件中。
3.版本查看
cat /usr/local/cuda-xx.x/include/cudnn.h | grep CUDNN_MAJOR -A 2
或者
cat /usr/local/cuda-xx.x/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
出现版本号即安装完成
参考链接Ubuntu 20.04安装CUDA & CUDNN 手把手带你撸_ubuntu cuda_哈希Map的博客-CSDN博客
三、多个cuda版本的切换和管理
参考链接:
linux下安装多版本cuda和cudnn_linux安装多个版本cuda和cudnn-CSDN博客
四、cuda 的卸载
卸载CUDA,主要执行的是CUDA自带的卸载脚本,读者要根据自己的cuda版本找到卸载脚本:
cuda10.0及以下的卸载:
sudo /usr/local/cuda-xx.x/bin//uninstall_cuda_xx.x.pl
sudo rm -rf /usr/local/cuda-xx.x
cuda10.1及以上的卸载:
sudo /usr/local/cuda-xx.x/bin/cuda-uninstaller
sudo rm -rf /usr/local/cuda-xx.x
在运行卸载程序时只会卸载cuda-xx.x而不会一并删除cudnn的文件,所以如果要卸载的cuda-xx.x没有配置cudnn,那么cuda-xx.x文件夹在卸载完成后会被自动删除,就无需运行rm命令;如果装了cudnn的话,cuda-xx.x还有一些残留的文件夹,因此需要rm命令或者手动删除。
参考链接:
ubuntu完全卸载CUDA_ubuntu卸载cuda和cudnn-CSDN博客
五、torch、torchvision的安装
在线安装
在线下载官网Previous PyTorch Versions | PyTorch
使用conda或者pip安装,使用官网的镜像下载很慢,建议使用其他的镜像源
离线安装
参考链接:
cuda、torch、torchvision对应版本以及安装_torchvision版本_李昂的的博客-CSDN博客
六卸载
......