先说设备参数:华硕天选2,配备intel集显和3060显卡,ubuntu的内核是5.13。
我装了两天的英伟达驱动没有成功,在淘宝上找了个大哥给我一小时装完了。最重要的是一句选择显卡的代码。
重装系统后我直接给他了电脑,接下来是流程:
sudo apt-get update #更新系统软件
sudo apt-get upgrade
ubuntu-drivers devices #查看支持的驱动,我是支持470和510
sudo apt-get install nvidia-driver-470
sudo prime-select nvidia #这一句是重点,来回切换独显和集显
sudo reboot #重启后生效
我试了一下,可以来回切换独显和集显,独显耗电大。切换intel显卡就用
sudo prime-select intel
另外,顺便讲一下conda换源:
给conda换源:用vim .condarc在home目录下创建一个源文件,粘贴anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror中的文字,后conda clean -i清理一下缓存,安装pytorch即可
接下来继续安装CUDA和CUDNN
网上的资料比较详细了,我只写我在其中有遇到的问题。
1. CUDA版本尽量与pytorch的版本一致。我要运行Swin Transform,在编译apex时提示我下vy一致,于是我卸载了之前安装的CUDA11.4又安装了11.1。更换CUDA版本的过程很曲折,并且把驱动也给弄坏了,于是我全部卸载了CUDA和英伟达驱动从头开始安装。
sudo apt-get remove --purge nvidia*
sudo apt-get --purge remove nvidia*
sudo apt-get autoremove
sudo apt-get --purge remove "*cublas*" "cuda*"
sudo apt-get --purge remove "*nvidia*"
2.CUDA的安装版本选用x86_64的.run文件。因为过程中会让我们选择是否安装驱动,而驱动在之前已经安装了,所以一定不要选择安装这个驱动(其他博主也说了)。
3.CUDNN这就比较有意思了,让我白白花了好多时间。以前的版本是运行:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
但现在不是了,是运行:
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
参考这个链接: