(二)Win10和Ubuntu16.04双系统下Ubuntu安装Tensorflow-GPU

上一篇文章主要讲解了双系统的安装,本文主要讲解Ubuntu16.04环境下安装Tensorflow-GPU1.4.0,之前师兄已经把大坑补平,本文更加详细的描述我的安装方法。

安装框架:1080Ti—ubuntu16.04 + cuda8.0 + cudnn6.0 + anaconda(python 3.5) + tensorflow-gpu1.4

0 对应版本

cuda 9.0对应的cudnn是7.0,但是tensorflow必须是1.6或者1.5的
cuda 8.0对应的cudnn是6.0,tensorflow必须是1.4
其他更新的对应关系暂时不知 ,等以后需要更新版本时再了解补充。

1 下载

驱动推荐从NVIDIA官网下载
在这里插入图片描述
选择符合你电脑显卡版本的驱动,点击 开始搜索,从下面的诸多选项中选择最后一个390.48的版本在这里插入图片描述
点击下载,得到NVIDIA-Linux-x86_64-390.48.run的文件,建议将文件名改为 390.run ,反正越简单越好,然后将其拷入到空的U盘中,同时U盘的名字也简单一些哦,后面会比较方便。

2 驱动安装

现在开始安装驱动

2.1 卸载旧版本驱动

桌面右键打开终端,输入

sudo apt-get --purge remove nvidia-*(需要清除干净)
sudo apt-get --purge remove xserver-xorg-video-nouveau

2.2 屏蔽开源驱动 nouveau

sudo gedit /etc/modprobe.d/blacklist.conf

添加以下内容:

blacklist amd76x_edac
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
blacklist vga16fb
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
(这里有一行空格)

说白了就是找到gedit /etc/modprobe.d路径下的blacklist.conf文件,在末尾添加上述内容。如果权限不够无法修改,可以这么做:
定位到/etc/modprobe.d文件夹右键打开终端窗口,输入:

sudo chown 你的用户名 文件名(本例即blacklist.conf)

就可以获得读写权限了。

2.3 重启

sudo reboot

2.3 重启后

进入Ubuntu,插入U盘,双击打开U盘,右键打开终端,查看第一行并用手机拍下,注意蓝色字体,马上要用到!!
在这里插入图片描述

2.4 关闭图形环境,否则驱动无法正常安装(执行本语句不会报“You appear to be running an X server”错误)

在终端输入

sudo service lightdm stop

此时应黑屏或者出现其他图案,桌面不能正常显示。

按Ctrl + Alt +F1(F1~F6均可)到x-server, Ctrl+Alt+F7是返回。输入用户名,回车,输入登陆密码。一定不要用小键盘的数字,会不对!

2.5 进入驱动程序所在文件夹

即刚刚拍的照片中的蓝色字体。

cd /media/cimslinux/Ubuntu 16.0

而后执行

sudo sh ./390.run -no-x-check -no-opengl-files -no-nouveau-check

当输入安装指令时,不要简单地输入 sudo ./…run,而是输入:
sudo sh ./NVIDIA.run -no-x-check -no-nouveau-check -no-opengl-files

-no-x-check:安装驱动时关闭X服务
-no-nouveau-check:安装驱动时禁用nouveau
-no-opengl-files:只安装驱动文件,不安装OpenGL文件

这样再reboot,就不会出现循环登录的问题。
安装程序应该开始,一路回车(如果出现安装阅读,按住回车直到100%)。报错The distribution-provided pre-install script failed!不必理会,继续安装。最重要的一步,安装程序问你是否使用nv的xconfig文件,这里一点要选yes,否则在启动x-window时不会使用nv驱动。(英文的,仔细看一下)

可能遇到问题:The target kernel has CONFIG_MODULE_SIG set,which means that it supports cryptographic signatures on kernel module. On some systems, the kernel may refuse to load modules without a valid signature from a trusted key.This system also UEFI Secure Boot enabled; many distributions enforce module signature verification on UEFI systems when Secure Boot is enabled. Would you like to sign the NVIDIA kernel module?
解决:禁用UEFI安全启动功能:启动电脑,然后按电脑的设置访问UEFI,本机器按[F2]键,不同的制造商可能有不同的设置,具体请参考主板说明书。
根据不同的UEFI版本,安全启动选项通常在一个选项卡下,这个选项卡可能被命名为“Boot”、“Security”或者“Authentication”,在类似的选项卡中查找,我们会发现一个“Secure Boot”选项,该选项默认设置为“Enabled”,选中它并回车,将其设置为“Disabled”,按[Apply]键存储设置,重新启动电脑即可安装我们需要的操作系统。


至此,安装成功~

2.6 重启 X-window 服务

sudo service lightdm start

2.7 查看显卡是否装好,运行

glxinfo | grep rendering

如显示"direct rendering: Yes",则已安装成功。
如果提示有问题,可能是系统里面没有安装mesa-utils,安装过程:在终端输入命令:sudo apt-get install mesa-utils
然后再运行命令:glxinfo | grep rendering

3 CUDA 8.0安装

进入官网按照下图所示选择安装。
在这里插入图片描述

执行 sudo sh cuda_8.0.27_linux.run
因为驱动之前已经安装,这里就不要选择安装驱动。其余的都直接默认或者选择是即可。 一路接受、回车。

添加环境变量:
sudo gedit /etc/profile
打开“profile”文件,在末尾处添加:(若权限不够,参照前面讲过的方法)

export PATH=/usr/local/cuda-8.0/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64$LD_LIBRARY_PATH

重启电脑
测试是否安装成功:

cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery #默认安装位置
sudo make ./deviceQuery

出现下图说明安装成功。
在这里插入图片描述

4 CUDNN 6.0安装

官网下载对应版本
需要注册个邮箱,很快的。
找到Download cuDNN v6.0 (April 27, 2017), for CUDA 8.0并下载得到cudnn-8.0-linux-x64-v6.0.tgz文件。
在这里插入图片描述
解压缩:

tar -xzvf cudnn-8.0-linux-x64-v6.0.tgz

复制相应的文件到指定目录即可:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

至此CUDA和CUDNN安装完成,在运行以下程序检测下是否成功。
查看 CUDA 版本:

cat /usr/local/cuda/version.txt
在这里插入图片描述

查看 CUDNN 版本:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
在这里插入图片描述

如果都能看到,那么恭喜,安装成功了。

5 Anaconda安装

写博客时的版本已经更新到了Anaconda 5.3.1—Python 3.7,可能你看到的时候又是更加新的版本,没关系,按我说的来。在这里插入图片描述
首先,进入官网下载Anaconda,版本没有要求,可以下最新版,官网说的很清楚,他们强烈建议你下载最新版的Anaconda,然后调用命令来把Python降级到3.5版本,行,我们按官方说的来。附其他官方版本在这里插入图片描述
选择Linux,点击下载,不用注册,可得到Anaconda3-5.3.1-Linux-x86_64.sh文件,
在这里插入图片描述

在文件所在目录右键终端输入

bash Anaconda3-5.3.1-Linux-x86_64.sh

一路回车+yes,下面这个需要注意,是添加到环境变量,记得填yes,要不然后面要自己添加,多走一步路。
在这里插入图片描述
最后可能会问你要不要装VSCode,你开心就好。
安装完成后,重新打开终端,输入python即可看到python版本和anaconda字样,代表安装成功了,输入exit()关闭。下面对Python进行降级。
重新打开终端输入

conda install python=3.5

然后等他完成就行了。结束之后,再次输入python查看版本信息,可以看到Python版本由原来的3.7.x降级到了3.5.x,成功!

补充:打开 Jupyter Notebook

非常简单,只需在终端输入

ipython notebook
在这里插入图片描述

6 在线安装Tensorflow-GPU=1.4.0

更简单,一句话:

pip install tensorflow-gpu==1.4

等他完成就行!
下面代码供测试gpu版tf是否安装成功:

python
>>>import tensorflow as tf
>>>a = tf.constant(1)
>>>b = tf.constant(2)
>>>c = a + b
>>>sess = tf.Session()
>>>sess.run(tf.global_variables_initializer())
>>>sess.run( c ) #结果输出3代表能够运行,安装成功。

当然,由于项目部署的需要,遇到主机不(cao)能(dan)联网的情况,安装Tensorflow-GPU=1.4.0可就不是一句能搞定的了,需要提前下载好一定版本的离线安装包,然后一个一个按顺序安装,这个我也已经弄好了,找个时间更新好了,或者你催我一下也可以。

小结

虽然上面说的都是Ubuntu16.04下的安装步骤,但是聪明的你一定会迁移到其他Ubuntu或者Windows版本上的对吧,就是下的文件类型改成对应系统版本的就行啦。

怎么样,严格按照我说的步骤安装,应该不会报错,省了你好多时间吧,不点个赞来个关注吗0.0?
(写博客不易,头发都掉完了,各位看官赏个五角一块的,我好去买霸王洗发水啊 duang~_~)
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值