最近买了块
Nvidia GeForce RTX 2070
显卡,配置深度学习环境。环境是Ubuntu 18.0.4
,Tensorflow 2.1.0
,cuda 10.1.243
,cuDNN 7.6.5
。网上的资料基本全是陈旧的,查看cuDNN
版本的部分全是错误的。因此记录备查(配置时间2020年6月24日)。
1. 安装显卡驱动
-
从官网下载驱动
-
sudo init 3
然后ctrl+alt+1
进入字符模式。(这里网上都说直接ctrl+alt+1
,实测无效) -
删除旧版驱动
sudo apt-get remove –purge nvidia* sudo ./Nvidia…run -uninstall # 这里Nvidia…run指的是下载的驱动的名字
-
禁用
Ubuntu
自带的Nouveau
驱动sudo vim /etc/modprobe.d/blacklist-nouveau.conf
在文档最后加入
blacklist nouveau
,然后执行以下命令使禁用生效并且重启。sudo update-initramfs -u sudo reboot
-
执行下载的驱动,只要执行了上面的步骤,提示什么都别管,全部选继续进行或者选no。使用
nvidia-smi
确认安装成功。Wed Jun 24 13:09:30 2020 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 450.36.06 Driver Version: 450.36.06 CUDA Version: 11.0 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 GeForce RTX 2070 On | 00000000:01:00.0 On | N/A | | 0% 40C P8 8W / 175W | 446MiB / 7979MiB | 1% Default | | | | N/A | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| | 0 N/A N/A 1457 G /usr/lib/xorg/Xorg 18MiB | | 0 N/A N/A 1576 G /usr/bin/gnome-shell 79MiB | | 0 N/A N/A 2249 G /usr/lib/xorg/Xorg 124MiB | | 0 N/A N/A 2408 G /usr/bin/gnome-shell 217MiB | | 0 N/A N/A 3832 G /opt/firefox/firefox-bin 2MiB | +-----------------------------------------------------------------------------+
2. 安装cuda和cuDNN
-
在本地环境安装,直接按照
Tensorflow
官网(
https://tensorflow.google.cn/install/gpu#install_cuda_with_apt)的方法进行安装。 -
如果使用虚拟环境,推荐使用
miniconda
,因为可以自动安装cuda
和cuDNN
并且不会和本地环境的cuda
和cuDNN
冲突。miniconda
的安装参考这篇博客(https://www.jianshu.com/p/edaa744ea47d)。conda install tensorflow-gpu
3. 查看安装的cuda和cuDNN版本
-
在本地环境安装的查看办法。
# cuda 版本 cat /usr/local/cuda/version.txt # CUDA Version 10.1.243 # cudnn 版本 #(这里网上都说`cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2`,实测无效) cat /usr/include/cudnn.h | grep CUDNN_MAJOR -A 2 # #define CUDNN_MAJOR 7 # #define CUDNN_MINOR 6 # #define CUDNN_PATCHLEVEL 4 # -- # #define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL) # # #include "driver_types.h" # 这个结果就表示我的CUDA版本为10.1.243, cuDNN版本为7.6.4
-
在
miniconda
里安装的查看办法。conda list | grep cuda # cudatoolkit 10.1.243 h6bb024c_0 defaults # cudnn 7.6.5 cuda10.1_0 defaults