1. 从nvidia官网下载nvdia驱动的.run文件和cudnn的tar包
sudo chmod +x xx.run
sudo ./xx.run
sudo ./xx.run --uninstall # 卸载
# cudnn的下载稍复杂, 需要登录, 且需要番茄才能有正常速度
# 需要配置环境变量
export LD_LIBRARY_PATH=${CUDNN_HOME}/lib64:$LD_LIBRARY_PATH
export CPLUS_INCLUDE_PATH=${CUDNN_HOME}/include:$CPLUS_INCLUDE_PATH
export PATH=${CUDA_HOME}/bin:$PATH
2. 报错的日志
/var/log/nvidia-installer.log # 驱动安装日志
/var/log/cuda-installer.log # cuda安装日志
3. 驱动安装报错解决
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
添加以下内容:
blacklist nouveau
options nouveau modeset=0
更新
sudo update-initramfs -u
reboot
验证
lsmod | grep nouveau # 如果没有输出则禁用nouveau成功, nouveau是ubuntu下的开源驱动
4. conda安装tensorflow需要的cudatoolkit
conda install cudatoolkit=11.0 cudnn # 这样他会自己找和cudatoolkit匹配的cudnn, 而cudatoolkit版本需要自己去找