2021.11.03 update
有时因为程序的问题,需要用到不同版本的CUDA,这时就需要做版本切换,具体过程如下:
1)先按正常的方法安装其他版本的CUDA,然后安装对应的cudnn版本,这里的过程跟之前写的安装过程没有冲突,不再需要做一次显卡驱动就是了。
2)更换软连接
cd /usr/local
sudo cp -r cuda cuda_bak # 先备份,不行就恢复
sudo rm -rf cuda #删除之前的软链接(原本指向11.4)
sudo ln -s /usr/local/cuda-10.0 /usr/local/cuda #生成新的软链接,指向10.0
然后再到.bashrc
文件中修改路径:
gedit ~/.bashrc
修改
把之前的
export PATH="/usr/local/cuda-11.4/bin:$PATH"
export LD_LIBRARY_PATH="/usr/lcoal/cuda-11.4/lib64:$LD_LIBRARY_PATH"
改成:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
3)最后source一下bashrc文件,再查看一下当前的CUDA版本有没有被转换过来
source ~/.bashrc
nvcc -V
如果nvcc显示的是你想要的版本,就说明一切操作正确,若是不行的话,可以先恢复,再仔细看看是哪里出错了。
又要给电脑重新配环境,相对难受,每台机子都有不一样的地方,这次弄G15笔记本用之前的安装方法不行,太狗血了。
一共需要安装三样东西:
- Nvidia driver
- CUDA
- CUDNN
1. Nvidia driver
最核心部分是成功安装Nvidia driver,显卡驱动,如果安装不成功就会无法进入图形化界面。
卡在clean … files 那里,太恶心了。
但如果真的安装的驱动版本不对,也别担心,在clean … files 那里进入非图形化界面,按 Ctrl+alt+F2 就可以了, 然后把安装的驱动卸载掉,再重启就可以再次进入图形化界面。
这里有两种情况,看看安装错误版本时用的是什么方法:
1)用ubuntu-drivers devices
和sudo apt install nvidia-driver-XXX
用第一个指令可以显示系统推荐的显卡驱动版本,然后用第二个指令来安装,我不知道其他电脑上能不能成功,很多文章是用这个方法装的,我装完就无法进入图形化界面,所以只能进入非图形化界面,运行指令删掉这个驱动
sudo apt-get remove nvidia-*
删完这个驱动,重启后就能重新进入图形化界面
2)当然,也有用Nvidia官网下载的驱动程序安装的,Nvidia-driver官网
我试了直接装
sudo sh NVIDIA-Linux-x86_64-470.82.00.run
和把Ubuntu自带的nouveau nvidia驱动以及图像界面关闭了再装还是不行,我之前在台式机这么做是可以的,应该是DELL 笔记本的一些情况有点不同,需要另外的操作,稍后说。
然后如果用这个方法还是装不了,就需要先卸载
卸载方法:sudo apt-get purge nvidia*
具体的安装过程有一个博主已经写得很清楚了,对一个G15这个机型得,感谢他得文章:
https://blog.csdn.net/m0_56077202/article/details/119078789
也是参考资料里面的第一个
要先到DELL官网去下个显卡驱动,我估计就是少了这步。
如果安装成功,用指令nvidia-smi
会弹出当前显卡配置的信息,那就成功了
2. CUDA
1)先到官网下载对应版本的CUDA,点击
选择runfile格式的CUDA文件下载
2)然后解压,安装就行了
sudo sh cuda_11.4.0_470.42.01_linux.run
这里就一个地方值得注意,开始安装后,第一个是accept
同意那些条款,然后就开始选安装的东西,如下图,我忘记保存了,但是选项是一样的
就是不要选第一个选项,然后就按Install开始安装就行了,过程十分顺利。
3)配置一下文件以及测试
gedit ~/.bashrc
在文件末尾添加
export PATH="/usr/local/cuda-11.4/bin:$PATH"
export LD_LIBRARY_PATH="/usr/lcoal/cuda-11.4/lib64:$LD_LIBRARY_PATH"
里面的cuda版本根据实际情况调整就好
最后使其生效
source ~/.bashrc
测试:
cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
有显示pass就成功了
同时nvcc --version
这个也可以显示cuda版本等信息
3. CUDNN
这个最容易装,其实都不需要安装,只需要到官网下载文件,点击,然后复制到cuda文件夹下就可以了。
选择顺数第二个下载,cuDNN Library for LInux(x86_64)
解压后的文件夹名称为cuda ,将对应文件复制到 /usr/local中的cuda内
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
如果想查看cudnn版本的,可以查看这个这个博文,点击,也是参考资料里面的第四个
然后就结束啦,恭喜
再次感谢显卡驱动安装部分的作者,感谢
Reference
- ubuntu18.04安装nvidia驱动(戴尔G15_3060版本):
https://blog.csdn.net/m0_56077202/article/details/119078789 - 深度学习环境配置(Nvidia驱动+CUDA+cuDNN):
https://blog.csdn.net/qq_35451572/article/details/79212421 - 真实机下 ubuntu 18.04 安装GPU +CUDA+cuDNN 以及其版本选择(亲测非常实用): https://blog.csdn.net/u010801439/article/details/80483036
- Ubuntu 18.4 查看CUDNN版本:
https://blog.csdn.net/eaxy_z/article/details/108615548 - Nvidia_driver:
https://www.nvidia.com/download/index.aspx?lang=en-us - Nvidia_cuda:
https://developer.nvidia.com/cuda-11-4-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=18.04&target_type=runfile_local - Nvidia_cudnn:
https://developer.nvidia.com/rdp/cudnn-download