Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU

最新推荐文章于 2021-12-21 18:35:16 发布

zzzbeauty

最新推荐文章于 2021-12-21 18:35:16 发布

阅读量486

点赞数

分类专栏：目标检测模型文章标签： ubuntu tensorflow pytorch

本文链接：https://blog.csdn.net/zzzbeauty/article/details/119383048

版权

目标检测模型专栏收录该内容

3 篇文章 0 订阅

订阅专栏

我安装的是系统是：Ubuntu 18.04.5 LTS
显卡是 2080TI
参考文章：点这里～

一、换国内源
打开终端：

sudo gedit /etc/apt/sources.list

在 deb 前面添加 # （将其备注）

选择自己系统对应的阿里源阿里源地址复制粘贴进去
比如我的系统就是选择：
在这里插入图片描述
保存之后更新：

sudo apt-get update
sudo apt-get upgrade

!!!我在这里遇到了lock的问题：解决办法

sudo rm /var/lib/dpkg/lock-frontend

顺便下载一下vim

sudo apt-get install vim

二、gpu驱动

禁用nouveau

sudo chmod 666 /etc/modprobe.d/blacklist.conf

//用gedit打开
sudo gedit /etc/modprobe.d/blacklist.conf

// 在最后一行加入以下几句，保存退出
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb

// 对刚才修改的文件进行更新
sudo update-initramfs -u

记得重启计算机，打开终端检查nouveau是否被禁用

lsmod | grep nouveau

\若执行完该句，没有任何输出，则nouveau被成功禁用
2. 卸载旧的驱动（因为我是新装的系统，所以这一步没有执行）
如果你是第一次安装gpu驱动，这一步可以省略。当然如果你不是第一次安装驱动，亲测也可以忽略这一步。

sudo apt-get remove --purge nvidia*

执行完上述命令后会有提示有残留，按照提示进行删除。
3. 安装gcc
必须先安装gcc, 才能安装gpu驱动。

sudo apt-get  install  build-essential

安装gcc,不要怀疑，就是build-essential，我也不知道为啥

gcc --version

检查gcc是否安装成功

这里我只安装了gcc，gpu驱动就可以成功安装了，如果你执行到下面，提示你make，g++没有安装的话，再回来执行以下语句进行安装即可。

sudo apt-get install g++
sudo apt-get install make

4、下载对应版本的gpu驱动
根据你的显卡类型选择合适的run文件下载，官网下载链接
按照自己系统的规格选择，“开始搜索”，我选择了第一个进行下载
!!!下载的路径不要有中文!!!
在这里插入图片描述 5、安装驱动
在上面的博文里面是要去命令行界面，但是我没去命令行界面执行好像也可以
Ctrl+Alt+F7，关闭图形界面（F1～F7都尝试一下，总有一个能进命令行界面）
cd到.run文件所在的位置：（注意要路径还有.run文件名替换为自己的）

//以移动后的目录为/home/xxx/为例
$cd /home/xxx/
//修改权限
$sudo chmod a+x NVIDIA-Linux-x86_64-xxx.run
//执行安装
$sudo ./NVIDIA-Linux-x86_64-xxx.run -no-x-check -no-nouveau-check -no-opengl-files

Ctrl+Alt+F2，恢复图形界面

nvidia-smi

出来显卡信息，则说明安装成功
在这里插入图片描述
三、Anacoda安装
1、去官网下载，linux选择第一个下载

cd到Anaconda3-2021.05-Linux-x86_64.sh安装包所在的位置：

bash Anaconda3-2021.05

然后一直按回车键，直到出现“Do you accept the license terms”, 输入“yes”

出现“Anaconda3 will now be installed into this location: /home/xxx/anaconda3”，直接按回车键，安装在该目录中。

出现“Do you wish the installer to initialize Anaconda3 by running condo init?”, 输入“no”。

这时anaconda已经基本安装完成了。
2、区分Ubuntu自带python和anaconda中的python
Linux中会自带python, Ubuntu18.04中自带python3,已经没有python2了。这时不区分不影响anaconda的正常使用，但pytorch和tensorflow对这Linux中自带的python3和anaconda中的python的使用需求不同，后期需要进行两者的切换。所以最好在这里就对他们进行区分。

先退回到根目录

cd ~

在1. 换国内源中已经安装过vim文本编辑器了，这里我们用vim打开.bashrc文件，并进行修改。

sudo vim .bashrc

输入小写字母i，进行vim的编辑模式。此时可以在.bashrc文件进行编辑了，在文件最后加入以下命令：

alias python3="/usr/bin/python3.6"
export PATH="/home/xxx/anaconda3/bin:$PATH"

给系统自带的python起一个别名，就叫python3(注意自己系统自带的python版本，ubuntu 18是3.6，ubuntu20 是3.8)

然后按下esc键，再输入:wq!进行保存，再按esc键退出vim编辑器。

继续在终端中对刚才修改的. bashrc文件执行以下。

source .bashrc

试试刚才进行区分的设置。
本条命令应该启动anaconda3中的python

python

退出

exit()

本条命令应该启动系统的python

python3

退出

exit()

3、创建pytorch环境

\\这步中pytorch可以换成任何你喜欢的名字
conda create -n pytorch python=3.8
\\查看你创建的环境
conda env list
\\激活创建的环境
conda activate Deeplearning
\\关闭环境
conda deactivate

注意!!!我执行conda activate Deeplearning语句会提示错误，将该句换为“source activate Deeplearning”即可
四、pytorch-cpu版本安装

为了可以在不使用GPU时也可以方便地对代码进行调试，先安装一个pytorch-cpu版本的。

激活你创建的pytorch环境,系统需要下载一些东西，这里会耗费一点时间。

conda activate pytorch

进入PyTorch官网，选择CPU版本
在这里插入图片描述
利用官网给的命令进行安装

python 
import torch

若没有输出，则说明安装成功,然后退出

exit()

在这里插入图片描述
五、cuda安装
CUDA官网
–>Download Now
按照自己的系统进行选择，最后一个选择runfile(local)
对应的安装语句在下面展示【CUDA11.4大约3.3G，要等待一会】
执行完 sudo sh…这句之后，需要等待几分钟出来一个黑框
"Do you accept the above EULA?"输入accept
在这里插入图片描述在下一个界面，有 X 代表安装
将Driver前面的 X 取消（通过Enter 键），其余都有X 要安装
选择Install
等待几分钟，出现这个界面则安装完成
2、配置环境

sudo vim ~/.bashrc

进入vim界面。输入字母i，进入编辑模式
在bashrc文件中输入以下命令，注意修改你的cuda版本

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.4/lib64
export PATH=$PATH:/usr/local/cuda-11.4/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.4

输入完成后，点击esc键并输入:wq!，再按esc键退出vim。
这时候返回终端了,运行.bashrc文件

source ~/.bashrc

3、检查安装是否成功

nvcc --version

或者

nvcc -V

注意!!!这里是大写的V，要不然报错
六、cudnn安装
cudnn的安装相比以上过程就简洁多了～但是在Nvidia下载cudnn文件时稍微有点麻烦，你需要先注册一个Nvidia账号，再填写一个调查问卷。
进入官网
根据你的cuda版本和电脑系统，选择合适的cudnn进行下载（大概1G多，需要一段时间进行下载）。我这里选择的是第二个Linux(x86_64)
在这里插入图片描述
下载好后，将.tz文件进行解压缩。
并打开终端，进入解压缩后的目录,

记得在你创建的虚拟环境中进行：

source activate pytorch

输入以下命令：

$sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/
 
$sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
 
$sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

七、pytorch-gpu安装
原博主是在官网下载的，但是我的不行
这个步骤！是我第一次安装时才的最大的坑了，通过在PyTorch安装的GPU版本并不行，找了好久才找到解决办法：
在确定CUDA和cudnn版本都没有下载错误后，安装完发现torch.cuda.is_available始终返回false，无论重装多少次，都一样。如果你遇到这个问题，不用担心你的步骤是不是错了，因为你被conda镜像安装给坑了。解决办法：手动去镜像网站下载gpu版的包并离线安装
虽然我安装的CUDA 是11.4 cudnn是8.2,但是pytorch-gpu版本就只到11.1版本，就下载这个！
下载下来可以用的！

在这里插入图片描述在虚拟环境中

source activate pytorch

注意选择路径

conda install --offline /home/zyc/Downloads/pytorch-1.9.0-xxxx.tar.bz2

等待一会就可以安装100%了,然后验证是否安装成功
!!!但是我这里又报错了，直接找不到torch模块，但是上面cpu版本已经经验证过安装好了，所以不应该报错阿！
这个时候请重启!!!
重启电脑！！！

python
import torch
torch.cuda.is_available()

再进入虚拟环境执行上面的语句

在这里插入图片描述
输出为 True 代表安装成功！
八、tensorflow-gpu安装
踩坑+1的地方，当时按照原博主的方案，花了我三四十G的流量不说，还没有安装好。
所以我仍采用的是：自己下载好包，再安装
清华的镜像网站
我选择了tensorflow2.5版本
在这里插入图片描述
创建虚拟环境：

conda create -n tensorflow python=3.8

进入环境：

source activate tensorflow

安装：注意路径

pip install /home/zyc/Downloads/tensorflowxxxxx.whl

进行验证：

python
import tensorflow as tf 
print(tf.test.is_gpu_available())

在这里插入图片描述最后输出为True 代表安装成功！！

终于！完结！
撒花～

zzzbeauty

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU

jiejue :https://blog.csdn.net/qq_35608277/article/details/83188337
复制链接

扫一扫

专栏目录

Ubuntu18.04配置Tensorflow-GPU && PyTorch-GPU

“相关推荐”对你有帮助么？