Ubuntu 18.0.4配置Tensorflow 2.1.0 GPU环境及 cuda&cuDNN版本查看（2020真实有效）

最新推荐文章于 2024-08-05 21:24:25 发布

小小和蓝胖

最新推荐文章于 2024-08-05 21:24:25 发布

阅读量678

点赞数 1

分类专栏： Tensorflow 2 文章标签： tensorflow gpu

本文链接：https://blog.csdn.net/Jerry_xzj/article/details/106942127

版权

Tensorflow 2 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

最近买了块Nvidia GeForce RTX 2070显卡，配置深度学习环境。环境是Ubuntu 18.0.4, Tensorflow 2.1.0, cuda 10.1.243, cuDNN 7.6.5。网上的资料基本全是陈旧的，查看cuDNN版本的部分全是错误的。因此记录备查（配置时间2020年6月24日）。

文章目录

1. 安装显卡驱动

从官网下载驱动
sudo init 3然后ctrl+alt+1进入字符模式。（这里网上都说直接ctrl+alt+1，实测无效）

删除旧版驱动

sudo apt-get remove –purge nvidia*
sudo ./Nvidia…run -uninstall # 这里Nvidia…run指的是下载的驱动的名字

禁用Ubuntu自带的Nouveau驱动
```
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
```
在文档最后加入blacklist nouveau，然后执行以下命令使禁用生效并且重启。
```
sudo update-initramfs -u
sudo reboot
```

执行下载的驱动，只要执行了上面的步骤，提示什么都别管，全部选继续进行或者选no。使用nvidia-smi确认安装成功。

Wed Jun 24 13:09:30 2020       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.36.06    Driver Version: 450.36.06    CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 2070    On   | 00000000:01:00.0  On |                  N/A |
|  0%   40C    P8     8W / 175W |    446MiB /  7979MiB |      1%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1457      G   /usr/lib/xorg/Xorg                 18MiB |
|    0   N/A  N/A      1576      G   /usr/bin/gnome-shell               79MiB |
|    0   N/A  N/A      2249      G   /usr/lib/xorg/Xorg                124MiB |
|    0   N/A  N/A      2408      G   /usr/bin/gnome-shell              217MiB |
|    0   N/A  N/A      3832      G   /opt/firefox/firefox-bin            2MiB |
+-----------------------------------------------------------------------------+

2. 安装cuda和cuDNN

在本地环境安装，直接按照Tensorflow官网（
https://tensorflow.google.cn/install/gpu#install_cuda_with_apt）的方法进行安装。
如果使用虚拟环境，推荐使用miniconda，因为可以自动安装cuda和cuDNN并且不会和本地环境的cuda和cuDNN冲突。miniconda的安装参考这篇博客（https://www.jianshu.com/p/edaa744ea47d）。
```
conda install tensorflow-gpu
```

3. 查看安装的cuda和cuDNN版本

在本地环境安装的查看办法。

# cuda 版本
cat /usr/local/cuda/version.txt
# CUDA Version 10.1.243

# cudnn 版本
#（这里网上都说`cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2`，实测无效）
cat /usr/include/cudnn.h | grep CUDNN_MAJOR -A 2
# #define CUDNN_MAJOR 7
# #define CUDNN_MINOR 6
# #define CUDNN_PATCHLEVEL 4
# --
# #define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)
#
# #include "driver_types.h"

# 这个结果就表示我的CUDA版本为10.1.243, cuDNN版本为7.6.4

在miniconda里安装的查看办法。

conda list | grep cuda
# cudatoolkit               10.1.243             h6bb024c_0    defaults
# cudnn                     7.6.5                cuda10.1_0    defaults