【2021.10.22 更新】
安装并检查driver
- 查看GPU driver版本:
nvidia-smi
,注意右上角的CUDA版本,该版本为driver支持的最大CUDA版本。
安装cuda
- 下载cuda:官网下载, 可以选择历史版本
Archive of Previous CUDA Releases
。下载完成后,按照网页提示安装即可。选择安装的内容时,需要将driver去除,因为你已经安装了driver。 - 打开
~/.bashrc
(为当前用户安装cuda)或者/etc/profile
(所有用户安装cuda),添加以下两句
然后# add cuda path export PATH="/usr/local/cuda-11.1/bin:$PATH" export LD_LIBRARY_PATH="/usr/local/cuda-11.1/lib64:$LD_LIBRARY_PATH"
source ~/.bashrc 或者 /etc/profile
- 测试是否安装成功:
nvcc -V
安装cudnn
- 下载cudnn:官网下载, 推荐下载deb文件。注意对应的ubuntu版本,3个deb都要下载。
- 安装cudnn:sudo dpkg -i libcudnn8-xxx
,先runtime,后dev,最后samples。 官方安装指南 - 测试是否安装成功: 官方测试指南
sudo cp -r /usr/src/cudnn_samples_v8/ ~/
cd ~/cudnn_samples_v8/mnistCUDNN/
sudo make clean
sudo make
-
如果
make
的时候出现test.c:1:10: fatal error: FreeImage.h: No such file or directory
,执行这条命令即可:sudo apt-get install libfreeimage3 libfreeimage-dev
。 sudo ./mnistCUDNN
- 出现
Test passed!
既是成功!
- 卸载cudnn:首先查找安装的cudnn
dpkg -l | grep cudnn
,然后用sudo dpkg -r libcudnn8-xxx
依次卸载samples,dev和runtime即可。
注意事项
手动配置tensorflow-gpu的重点在于版本匹配,主要包括:
-
NVIDIA的驱动版本与CUDA版本兼容
driver与CUDA版本对应关系
命令行下载安装CUDA(或sudo apt-get install cuda-toolkit-10-0
)
各版本CUDA下载链接
CUDA安装指南
查看可用GPU:$ lspci | grep -i nvidia
查看linux版本:$ uname -m && cat /etc/*release
查看驱动版本:$ nvidia-smi
查看当前安装的cuda版本:$ cat /usr/local/cuda/version.txt -
CUDA版本与cuDNN兼容 CUDA与cuDNN版本对应关系
-
tensorflow与CUDA版本兼容 tensorflow与CUDA版本对应关系
查看安装的tensorflow版本:$ conda list
安装特定版本的tensorflow:$ pip install tensorflow-gpu==1.14.0
如果已经安装了显卡驱动,在cuda的安装过程中,请勿安装cuda自带的驱动,要在那一项选择n
。否则可能会导致电脑在开机之后会进入无限登录的循环。
如果不幸导致无限登录循环,请按ctrl+alt+F1
进入文本模式,卸载所有显卡驱动,具体可参考这篇博客。解决无限登录