Ubuntu20.04安装Nvidia显卡驱动、CUDA11.5、cuDNN8.3、Anaconda及Tensorflow-GPU版本详细图文操作教程

一、下载安装程序

1.下载Nvidia显卡驱动

登录Nvidia官方网站,在下拉菜单选择自己的信息,下载最新驱动程序(以本人3070Laptop为例)。尽量下载最新驱动,不然tensorflow-gpu安装可能会出现问题!
Nvidia驱动下载:https://www.nvidia.cn/geforce/drivers/
在这里插入图片描述

搜索完成后,点击下载,保存到任意目录下(默认下载到~/Downloads)。
在这里插入图片描述

2.下载Anaconda安装包

登录Anaconda官方网站,按照个人需求选择版本,这里我选个人版
Anaconda官方网站:https://www.anaconda.com/
在这里插入图片描述
点击Downloads,保存到任意目录下(默认下载到~/Downloads)。
在这里插入图片描述

3.下载CUDA和cuDNN

前往官方网站下载CUDA,具体需要哪个版本,需要前往cuDNN下载页面,查看当前能够支持的版本号,必须与之相对应,否则无法安装成功。上图为CUDA下载页面,下图为cuDNN下载页面。下载的CUDA放在默认的Downloads文件夹下就可以了。
显卡驱动与CUDA版本对应关系:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
CUDA最新版本:https://developer.nvidia.com/cuda-downloads
CUDA历史版本:https://developer.nvidia.com/cuda-toolkit-archive
cuDNN最新版本:https://developer.nvidia.com/rdp/cudnn-download
cuDNN历史版本:https://developer.nvidia.com/rdp/cudnn-archive
在这里插入图片描述
显卡驱动与CUDA对应关系
在这里插入图片描述
这里我安装的驱动是495.46,对应CUDA应该选择11.5
在这里插入图片描述
11.5CUDA对应选择cuDNN版本为8.3.1,但是要看清楚8.3.1有两个
在这里插入图片描述
注意:如果不安装CUDA和cuDNN,也可以进行Tensorflow-gpu安装,完成后显示安装成功,import tensorflow不会报错,但无法使用GPU进行运算。仅安装CUDA可以运行Tensorflow的GPU运算,但运算速度较慢,安装cuDNN可以显著加快运算。
CUDA请下载.run格式的版本,.deb安装较为麻烦且不易成功。
在这里插入图片描述
下载cuDNN前,需要注册帐号,并完成资料填写,按照要求填完即可下载
下载完成(因为cuDNN目前最新支持CUDA11.5,故笔者下载CUDA11.5.0和cuDNN8.3.2)
在这里插入图片描述
检查一下是否齐全,一共4个安装包,其中Nvidia相关驱动3个、Anaconda安装包1个

二、安装Nvidia显卡驱动

1.禁用nouveau

因为Ubuntu自带的驱动和我们要安装的Nvidia驱动有冲突,故需禁用。
首先修改配置文件,打开“终端”(Ctrl+Alt+T)

sudo gedit /etc/modprobe.d/blacklist.conf

找到最后一行,在末尾加入下列内容,将nouveau列入黑名单

blacklist nouveau
options nouveau modeset=0

完成后如下图所示,点击“保存”,而后退出
在这里插入图片描述
应用刚才修改的配置

sudo update-initramfs -u
reboot

重启后验证更改是否生效

lsmod | grep nouveau

没有输出则代表已经禁用

2.运行安装程序

关闭图形化界面(非必要操作,有时不关闭无法完成旧驱动卸载)

sudo telinit 3

卸载旧版本nvidia驱动

sudo apt-get remove --purge nvidia* 

CD到下载目录,使用sh命令进行安装(20.04版本不需要增加chmod +x可执行权限,可以直接运行)
第一次运行安装程序有极大可能性会报错,部分问题可参考本章第3条,此处为顺利安装的情况

sudo sh NVIDIA-Linux-x86_64-495.46.run

点击Contiue,不影响安装
在这里插入图片描述
无问题则开始读条,期间可能弹出警告,缺少32位运行库,无视
在这里插入图片描述
读条结束后,提示是否需要使用Nvidia工具自动更新配置文件,选No,以免破坏我们安装好的环境
在这里插入图片描述
能走到上面一步,基本上已经安装成功了,现在检验一下

nvidia-smi

如下图所示,表示安装正确,安装失败则会报错
在这里插入图片描述

Nvidia x控制面板也显示正常
在这里插入图片描述

3.常见问题解决

(1)缺少gcc

sudo apt-get  install  build-essential

(2)缺少g++

sudo apt-get install g++

(3)缺少make

sudo apt-get install make

(4)因为缺少依赖环境导致无法安装
有时会比较棘手,问题层出不穷,可按以下方法尝试

sudo apt --fix-broken install
sudo apt-get update
sudo apt-get upgrade

如果IP无法访问,则需要更改安装源,先备份、后修改

sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup
sudo gedit /etc/apt/sources.list

将全部内容都删除,只保留以下内容(也可换别的源)

deb http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-proposed main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ bionic-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ bionic-backports main restricted universe multiverse

如果apt-get update依然找不到源,可以尝试将/etc/apt/sources.list.d文件夹下对应的文件删除
然后再进行update、upgrade

三、安装CUDA

1.运行安装程序

打开终端

sudo sh cuda_11.5.0_495.29.05_linux.run

输入accept
在这里插入图片描述
因为我们事先安装好了显卡驱动,所以Driver这里要取消,其他的全部安装,点击Install
在这里插入图片描述
安装完成
在这里插入图片描述

2.配置环境变量

添加环境变量

gedit ~/.bashrc

在末尾处增加以下内容,其中cuda-11.5这里是我的版本号,如果安装其他版本请相应调整。

export PATH=/usr/local/cuda-11.5/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.5/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

在这里插入图片描述
完成后点击保存,退出。输入source ~/.bashrc应用环境变量

source ~/.bashrc

查看版本号,如果正常显示,代表安装成功

nvcc -V

在这里插入图片描述
注:有教程说需要降级gcc版本,笔者仅有gcc9,未安装gcc7依旧能够成功。

四、安装cuDNN

Nvidia官方安装介绍:https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html
在这里插入图片描述
完全按照官方操作即可,大概意思是将文档中的X.Y修改成CUDA版本号、v8.x.x.x修改成cuDNN版本号,这里我们将X.Y改为11.5、v8.x.x.x修改为8.3.2.44,同学们参照修改就可以了。

tar -xvf cudnn-linux-x86_64-8.3.2.44_cuda11.5-archive.tar.xz

成功提取文件后不用管它,继续执行命令

sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include 
sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

在这里插入图片描述
验证安装

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

在这里插入图片描述

五、安装Anaconda

1.运行安装程序

cd到Anaconda文件目录下进行安装

sh Anaconda3-2021.11-Linux-x86_64.sh

看完很长的文档后,开始操作(不想看文档可以按Ctrl+C跳过,不会退出安装)
第一个提示表示是否接受条款并安装,输入yes;
第二个提示表示是否在默认目录下安装,建议同意,直接敲回车;
第三个提示表示是否需要conda进行初始化,输入yes。

测试是否安装成功

anaconda-navigator

启动Anaconda的控制面板,成功运行则如下图所示
在这里插入图片描述

2.创建快捷方式

创建桌面快捷方式

cd ~/Desktop
gedit Anaconda.desktop

在文本编辑器里面复制下列代码,注意需要将Exec和Icon参数中的username替换为您自己的帐号名称,然后保存

[Desktop Entry]
Version=1.0
Name=Anaconda
Type=Application
GenericName=Anaconda
Comment=Scientific Python Development Environment - Python3
Exec=/home/username/anaconda3/bin/anaconda-navigator
Categories=Development;Science;IDE;Qt;Education;
Icon=/home/username/anaconda3/lib/python3.9/site-packages/anaconda_navigator/static/images/anaconda-icon-256x256.png
Terminal=false
StartupNotify=true

右键点击桌面图标,选择“允许启动”
在这里插入图片描述

六、安装Tensorflow

通过Anaconda安装Tensorflow,使用conda命令安装,可自动适配符合系统的版本工具,轻松完成Tensorflow安装,比pip安装成功率更高
在Anaconda中创建tensorflow环境

conda create -n tensorflow

激活并切换到tensorflow环境,成功切换的话括号内的名称则会变为tensorflow

source activate tensorflow

在这里插入图片描述
安装Tensorflow的GPU版本

conda install tensorflow-gpu

经过一段时间的等待,出现三个“done”完成安装
在这里插入图片描述
我们来进python测试一下,import tensorflow无显示,安装成功
在这里插入图片描述

七、配置PyCharm调用Anaconda的Tensorflow环境

回到Anaconda Navigator面板,按下Ctrl+p,打开设置面板,在最下面加入PyCharm的绝对路径,这样我们就可以从Anaconda中启动PyCharm了(不设置也不影响使用)
在这里插入图片描述
启动PyCharm,按下Ctrl+Alt+s,打开设置面板,将Jupyter服务器的Python解释器设置为我们刚装好的tenserflow环境(如果以前没有运行过Jupyter文件,可能需要先安装PyCharm的Jupyter服务器)
在这里插入图片描述

  • 18
    点赞
  • 99
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
自编译tensorflow: 1.python3.5,tensorflow1.12; 2.支持cuda10.0,cudnn7.3.1,TensorRT-5.0.2.6-cuda10.0-cudnn7.3; 3.支持mkl,无MPI; 软硬件硬件环境:Ubuntu16.04,GeForce GTX 1080 配置信息: hp@dla:~/work/ts_compile/tensorflow$ ./configure WARNING: --batch mode is deprecated. Please instead explicitly shut down your Bazel server using the command "bazel shutdown". You have bazel 0.19.1 installed. Please specify the location of python. [Default is /usr/bin/python]: /usr/bin/python3 Found possible Python library paths: /usr/local/lib/python3.5/dist-packages /usr/lib/python3/dist-packages Please input the desired Python library path to use. Default is [/usr/local/lib/python3.5/dist-packages] Do you wish to build TensorFlow with XLA JIT support? [Y/n]: XLA JIT support will be enabled for TensorFlow. Do you wish to build TensorFlow with OpenCL SYCL support? [y/N]: No OpenCL SYCL support will be enabled for TensorFlow. Do you wish to build TensorFlow with ROCm support? [y/N]: No ROCm support will be enabled for TensorFlow. Do you wish to build TensorFlow with CUDA support? [y/N]: y CUDA support will be enabled for TensorFlow. Please specify the CUDA SDK version you want to use. [Leave empty to default to CUDA 10.0]: Please specify the location where CUDA 10.0 toolkit is installed. Refer to README.md for more details. [Default is /usr/local/cuda]: /usr/local/cuda-10.0 Please specify the cuDNN version you want to use. [Leave empty to default to cuDNN 7]: 7.3.1 Please specify the location where cuDNN 7 library is installed. Refer to README.md for more details. [Default is /usr/local/cuda-10.0]: Do you wish to build TensorFlow with TensorRT support? [y/N]: y TensorRT support will be enabled for TensorFlow. Please specify the location where TensorRT is installed. [Default is /usr/lib/x86_64-linux-gnu]:/home/hp/bin/TensorRT-5.0.2.6-cuda10.0-cudnn7.3/targets/x86_64-linux-gnu Please specify the locally installed NCCL version you want to use. [Default is to use https://github.com/nvidia/nccl]: Please specify a list of comma-separated Cuda compute capabilities you want to build with. You can find the compute capability of your device at: https://developer.nvidia.com/cuda-gpus. Please note that each additional compute capability significantly increases your build time and binary size. [Default is: 6.1,6.1,6.1]: Do you want to use clang as CUDA compiler? [y/N]: nvcc will be used as CUDA compiler. Please specify which gcc should be used by nvcc as the host compiler. [Default is /usr/bin/gcc]: Do you wish to build TensorFlow with MPI support? [y/N]: No MPI support will be enabled for TensorFlow. Please specify optimization flags to use during compilation when bazel option "--config=opt" is specified [Default is -march=native -Wno-sign-compare]: Would you like to interactively configure ./WORKSPACE for Android builds? [y/N]: Not configuring the WORKSPACE for Android builds. Preconfigured Bazel build configs. You can use any of the below by adding "--config=" to your build command. See .bazelrc for more details. --config=mkl # Build with MKL support. --config=monolithic # Config for mostly static monolithic build. --config=gdr # Build with GDR support. --config=verbs # Build with libverbs support. --config=ngraph # Build with Intel nGraph support. --config=dynamic_kernels # (Experimental) Build kernels into separate shared objects. Preconfigured Bazel build configs to DISABLE default on features: --config=noaws # Disable AWS S3 filesystem support. --config=nogcp # Disable GCP support. --config=nohdfs # Disable HDFS support. --config=noignite # Disable Apacha Ignite support. --config=nokafka # Disable Apache Kafka support. --config=nonccl # Disable NVIDIA NCCL support. Configuration finished 编译: hp@dla:~/work/ts_compile/tensorflow$ bazel build --config=opt --config=mkl --verbose_failures //tensorflow/tools/pip_package:build_pip_package 卸载已有tensorflow: hp@dla:~/temp$ sudo pip3 uninstall tensorflow 安装自己编译的成果: hp@dla:~/temp$ sudo pip3 install tensorflow-1.12.0-cp35-cp35m-linux_x86_64.whl
Ubuntu 20.04安装cuDNN,你可以按照以下步骤进行操作: 1. 首先,将blacklist.conf文件末尾加上以下两行,并保存: ``` blacklist nouveau options nouveau modeset=0 ``` 然后在终端中输入以下命令,以应用更改: ``` sudo update-initramfs -u ``` 2. 重启你的系统以禁用Ubuntu 20.04自带的nouveau显卡驱动。 3. 接下来,打开系统设置,选择"软件和更新",然后点击"附加驱动"。在该界面中,你可以选择NVIDIA驱动,并点击"应用更改"按钮。系统会自动推荐适用于你电脑上GPUNVIDIA显卡驱动。 4. 安装NVIDIA驱动后,你可以根据需要安装cuDNN。你可以参考一份详细图文教程来学习如何在Ubuntu 20.04安装CUDAcuDNN。这份教程会通过图文和代码的方式提供详细的步骤和说明,对于学习或工作都有一定的参考价值。 希望以上信息对你有所帮助!如果有任何进一步的问题,请随时提问。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Ubuntu20.04CUDAcuDNN详细安装与配置过程(图文)](https://blog.csdn.net/weixin_37926734/article/details/123033286)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [Ubuntu 20.04 CUDA&cuDNN安装方法(图文教程)](https://download.csdn.net/download/weixin_38696582/12840997)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值