Ubuntu 18.04深度学习环境配置(CUDA9.0+CUDDN7.4.1+TensorFolw+Pytorch)

之前花了很长时间来查询配置环境的方法,但是大多有点老了,配置的方法也不一样,有些显得过于复杂,本人试过多种配置方法,基本上大家说过的坑都踩过,最近因为环境出了问题,所以重新配置一下,刚好写个博客记录整理一下。

1、NVIDIA驱动安装
1)默认安装的显卡驱动不是英伟达的驱动,所以先把旧的驱动删除掉。

sudo apt-get remove --purge nvidia*

如果使用.run文件安装,使用–uninstall卸载(具体方法百度)

2)禁用nouveau

安装NVIDIA需要把系统自带的驱动禁用,打开文件:

sudo gedit /etc/modprobe.d/blacklist.conf

在文本最后添加以下内容:

blacklist nouveau
option nouveau modeset=0

命令窗口会提示warn,无视之。
保存退出,执行以下命令生效:

sudo update-initramfs -u

重启电脑后输入:

lsmod | grep nouveau

没有任何输出说明禁用成功。

3)添加Graphic Drivers PPA

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update

查看合适的驱动版本:

ubuntu-drivers devices

在这里插入图片描述
我这里选择的推荐的nvidia-415

sudo apt-get install nvidia-driver-415

4)安装完毕后重启机器:

reboot

重启后查看是否安装成功:

nvidia-smi

安装成功显示一些信息,如图
在这里插入图片描述
2、安装依赖库:

 sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-devlibgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

3、GCC版本降级
1)CUDA9.0要求GCC版本是5.x或者6.x,其他版本不可以,需要自己进行配置,通过以下命令才对GCC版本进行修改。

 #版本安装
 sudo apt-get install gcc-5
 sudo apt-get install g++-5

2)设置默认的gcc版本
(可选)查看当前版本,不出意外的话会返回Ubuntu 18.04自带的7.3.0这个版本号,现在使用gcc命令编译时还是会用新版本。

gcc --version

(可选)查看已有的gcc版本,确认一下刚才有没有装成功。

ls /usr/bin/gcc*

通过命令替换掉之前的版本

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50

如替换出现问题,需要手动模式,输入下面的命令根据提示进行替换:

sudo update-alternatives --config gcc

4、CUDA9.0安装

在安装CUDA和CUDNN中还没有匹配版本,最高也是17.04的版本,但实际上ubuntu18.04的版本具有很强的兼容性,所以选择17.04的也可以用

CUDA9.0下载地址:
https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1704&target_type=runfilelocal

版本选择:
linux–x86-64,Ubuntu–17.04,runfile(local),下载Base Installer和4个Patch

进入下载目录后,依次执行命令:

注意:在安装过程中会提示是否需要安装显卡驱动,在这里要选择n,其他的选择y或者回车键进行安装:

sudo ./cuda_9.0.176_384.81_linux.run
sudo ./cuda_9.0.176.1_linux.run
sudo ./cuda_9.0.176.2_linux.run
sudo ./cuda_9.0.176.3_linux.run
sudo ./cuda_9.0.176.4_linux.run

安装完成后使用gedit打开环境文件:

sudo gedit ~/.bashrc

在最后添加:

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}} 
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

运行

source ~/.bashrc

使其生效,然后重启一下

reboot

重启后,测试CUDA是否成功

cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make 
sudo ./deviceQuery

若会输出相应的显卡性能信息,Result = PASS,表明CUDA安装成功。

查看cuda版本:

nvcc -V

卸载cuda:

sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
sudo rm -rf /usr/local/cuda-9.0/

如果安装失败有可能是依赖没安装好,执行命令:

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev

安装好后重启一下再看看

5、CUDNN7.4.1安装
下载地址(需要注册才能安装):https://developer.nvidia.com/rdp/cudnn-download

下载与CUDA9.0对应的版本,CUDNN7.4.1即可

解压下载的文件,可以看到cuda文件夹,在当前目录打开终端,执行如下命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

没有报错就是全部安装完成了

查看cudnn版本:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

出现版本信息证明安装成功

6、安装Tensorflow Gpu
由于Anaconda可以提供完整的科学计算库,所以直接使用Anaconda来进行相关的安装。这应该也是最不容易出错的方法。

1)安装Anaconda

下载地址:https://www.anaconda.com/download/
这里我们下载Python 3.7 64bit 的Anaconda,下载好后直接安装即可。

sudo bash Anaconda3-5.3.0-Linux-x86_64.sh

2)更改pip和conda为国内的源

由于国内访问pip和conda比较慢,建议更改为国内的源:

a.更改pip的源为阿里云:

mkdir ~/.pip

cat > ~/.pip/pip.conf << EOF
[global]
trusted-host=mirrors.aliyun.com
index-url=https://mirrors.aliyun.com/pypi/simple/
EOF

b.更改conda的源为清华大学:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

3)在Anaconda中安装Python3.6的虚拟环境

由于Anaconda的python版本是3.7的,TensorFlow暂时不支持此版本,所以先创建一个Python的虚拟环境

conda create --name tf python=3.6 #创建tf环境

虚拟环境主要命令:

source activate tf            #激活tf环境
source deactivate tf          #退出tf环境
conda remove --name tf --all  #删除tf环境(全部删除)

4)在Anaconda中安装TensorFlow GPU (需要哪个版本在后面添加即可,不然默认安装最新版)

pip install --ignore-installed --upgrade tensorflow-gpu

将会自动安装如下组件:
numpy 、wheel 、tensorflow-tensorboard 、six、protobuf 、html5lib 、markdown、werkzeug 、bleach、setuptools

5)使用下列代码测试安装正确性

命令行输入:

source activate tf
python
import tensorflow as tf
hello= tf.constant('Hello, TensorFlow!')
sess= tf.Session()
print(sess.run(hello))

没有报错就是配置好了。

7.安装Pytorch

直接在这个虚拟环境中安装:

conda install pytorch torchvision -c pytorch

测试Pytorch是否安装成功:

source activate tf
python
import torch
print(torch.cuda.is_available())

返回True说明安装成功了。

参考:
Ubuntu18.04深度学习GPU环境配置
机器学习初学者

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值