Ubuntu16.04+nvidia_418.56+cuda_10.0+cudnn_7.5+tensorflow_gpu_1.14

Ubuntu16.04+nvidia_418.56+cuda_10.0+cudnn_7.5+tensorflow_gpu_1.14

配置:
Ubuntu 16.04
NVIDIA: 418.56
cuda:10.0
cudnn:7.5.1
tensorflow:1.14

参考:
https://blog.csdn.net/u014561933/article/details/79958017#0%E7%8E%AF%E5%A2%83 # nvidia
https://blog.csdn.net/roach_zfq/article/details/53883976 # 华硕主板禁用UEFI
https://zhuanlan.zhihu.com/p/65557545 # cuda
https://blog.csdn.net/WangJiankun_ls/article/details/93238352 # cudnn

一、查看所有ubuntu推荐的驱动以及当前电脑的显卡型号

ubuntu-drivers devices

二、安装nvidia:
这里安装nvidia和cuda都是用runfiles文件进行的安装:
到这个网址去查看显卡适合的nvidia:
https://www.geforce.cn/drivers
在这里插入图片描述
我选择的是: NVIDIA-Linux-x86_64-418.56.run
并且将它放在了/home/lx/software 文件夹下。

A.首先,卸载旧驱动:
进入之前旧驱动安装的文件夹,打开终端,输入:

    sudo ./ NVIDIA-Linux-x86_64-430.40.run --uninstall     

B.安装其他需要的依赖:

 sudo apt-get update 
 sudo apt-get install dkms build-essential linux-headers-generic
 sudo apt-get install gcc-multilib xorg-dev
 sudo apt-get install freeglut3-dev libx11-dev libxmu-dev 
sudo apt-get install libxi-dev  libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

C.禁用noueau驱动:

sudo gedit /etc/modprobe.d/blacklist-nouveau.conf 

D.在打开的文件中加入如下内容:

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

E.保存退出后禁用nouveau内核模块

echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
sudo update-initramfs -u
reboot                                                                                                                  #重启
lsmod |grep nouveau                                                                                           #无显示则成功

F.进入blos关闭secure boot (华硕还有fast boot)
我的主板是华硕,所以重启电脑后一直按F2,进入到blos界面。进入洁面后如下:
在这里插入图片描述
G.华硕主板也需要禁用fast boot(我是禁用了,其他人可以试一试。)

H.ctrl+alt+F1
登录,输入账户名和密码

sudo service lightdm stop
cd /home/lx/software   
chmod a+x NVIDIA-Linux-x86_64-418.56.run                                      # 添加权限
sudo ./NVIDIA-Linux-x86_64-418.56.run --dkms --no-opengl-files        # 如果不加 --no-opengl-files 则会在安装成功后出现循环登录的现象

I.安装结束,验证:

nvidia-smi

J.出现下面的界面则说明安装nvidia-smi成功了:
在这里插入图片描述
重新进入界面:

sudo service lightdm start
nvidia-settings                                               # 这里的settings 有可能会出现Unable to load info .... 不用管它

再次提醒,如果出现循环登录的现象,就ctrl+alt+f1,sudo service lightdm stop, 卸载Nvidia。

三、安装cuda
cuda下载网址:https://link.zhihu.com/?target=https%3A//developer.nvidia.com/cuda-10.0-download-archive
我下载的版本:cuda_10.0.130_410.48_linux.run

A.ctrl+alt+f1

登录自己的账号和密码

sudo service lightdm stop
cd /home/lx/software                                                                                     # cuda.run文件所在文件夹
chmod a+x cuda_10.0.130_410.48_linux.run                                               # 添加权限
sudo ./cuda_10.0.130_410.48_linux.run

B.按照如下图所示选择:
在这里插入图片描述
C.配置完成,等待一会,出现输入界面后,将cuda配置到环境变量中:

sudo gedit ~/.bashrc

D.在弹出来的文档末尾添加下面路径:

export PATH=/usr/local/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH 

E.运行:

source ~/.bashrc

F.查看cuda是否安装完成:

nvcc --version

G.如果出现下面的图则说明安装完成:
在这里插入图片描述
四、安装cudnn
cudnn下载网址:https://developer.nvidia.com/rdp/cudnn-download # 这个需要注册账号然后下载
我所用的版本:cudnn7.5.1
A.打开终端,输入:

cd /home/lx/software                                                                                                     # cudnn文件所在地
sudo dpkg -i libcudnn7_7.5.1.10-1+cuda10.0_amd64.deb                                          # 这个要跟你自己下载的cudnn版本名一致
sudo dpkg -i libcudnn7-devel_7.5.1.10-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.5.1.10-1+cuda10.0_amd64.deb

B.安装结束,检测cudnn安装的情况:

#其实这一步我没有做检查。。。
cp -r /usr/src/cudnn_samples_v7/ $HOME
cd  $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN

C.*** 说是如果出现Test passed 就成功了

五、安装tensorflow-gpu
打开pycharm–>Fiel–>Settings–>Project:pycharm_code–>Project Interpreter
点击Latest Version旁边的加号,在加号里面搜索tensorflow-gpu # 这里我安装的GPU-tensorflow是1.14.0版本的
再点击Install Package
在这里插入图片描述

直到显示tensorflow安装成功。

A.检测tensorflow-gpu是否安装成功:
新建test-1.py:

import tensorflow as tf
from tensorflow.python.client import device_lib

print(device_lib.list_devices())
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))

B.run运行:
在这里插入图片描述
C.最后出现了GPU:0,验证tensorflow-gpu安装成功。

D.再次运行另外一个训练的程序,打开终端,输入nvidia-smi,可以看到GPU已经在开始工作了:
在这里插入图片描述
后续: 说是这里的cuda和cudnn搭配也可以安装tensorflow-gpu2.0版本的。但是我没有尝试。
目前为止,tensorflow-gpu已经安装好了。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值