记一次在ubuntu16.04上安装tensorflow-gpu的过程

本文详细记录了在Ubuntu 16.04系统上安装tensorflow-gpu 1.4.1及CUDA 8.0的过程,包括遇到的坑与解决方案。由于阿里云pypi镜像只提供tensorflow-gpu 1.4.1,故选择该版本,硬件环境为NVIDIA Tesla M40显卡。遵循的主要步骤包括安装CUDA,cudnn,最后是tensorflow-gpu,过程中需特别注意避免安装错误的CUDA版本。
摘要由CSDN通过智能技术生成

前言:
tensorflow已经安装了很多遍了,也填平了好多坑了。XX说过:“世界上本来没有大牛,爬的坑多了就有了大牛”。

这是一篇安装类的文章,这类文章的时效性非常高。注意我安装的时间是2018-01-05。这个时候这个世界的snapshot是:ubuntu17.04, tensorflow-gpu 1.5.0, cuda9.1, cudnn7.1都已经有了。但是我这次安装是在阿里云上安装的,在阿里云的pypi镜像上只有1.4.1的所以我也只安装1.4.1的。(pip配置http://mirrors.aliyun.com/pypi/simple/tensorflow-gpu/)

因此我本次安装的是:ubuntu16.04 + tensorflow1.4.1 + cuda8.0 + cudnn6.0 .
硬件是 NVIDIA Corporation GM200GL [Tesla M40] (rev a1)。 阿里云上最便宜的gn4。

主要思路是参考:https://tensorflow.google.cn/install/install_linux。无非三部:一,cuda,二cudnn,三tensorflow

1 安装cuda8.0

大而全的无用的完全安装手册: http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions
这个手册太复杂了,简直不能看。万不得已,不要看。
1.1 下载软件
https://developer.nvidia.com/cuda-80-ga2-download-archive
这里点开直接给出了8.0的下载地址。参考下面的图选择安装方式。我选择的是deb(local)。网上也有很多教程是runfile的。

注意我们都在linux下面了,直接用wget命令下载,不用什么浏览器打开吧。
1.2 local deb方式
wget "https://developer.nvidia.com//compute/cuda/8.0/prod/local_installers/cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb" -O cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb
然后根据图上的命令执行:
  1. `sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb`
  2. `sudo apt-get update`
  3. `sudo apt-get install cuda`坑王在此,他坑退避。这样执行的话,直接安装了最新版本(当前是9.1,而tensorflow1.4.1不支持,所以这如果安装错误,那么得卸载重装)。所以这里一定执行sudo apt-get install cuda-8-0。更详细的描述见https://devtalk.nvidia.com/default/topic/1024342/cuda-setup-and-installation/unable-to-uninstall-cuda-9-0-completely-and-install-8-0-instead/
1.3 deb(network) 这里是和1.2并列的。按照1.2安装,这里可以跳过了。
wget "http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_8.0.44-1_amd64.deb" -O "cuda-repo-ubuntu1604_8.0.44-1_amd64.deb" 这里只给出命令,后续步骤和1.2中类似。
NOTE:怎么得到各个版本的下载地址呢?每个版本点击右键有惊喜。
1.4 检查安装是否成功
能正常运行nvidia-smi即可
1.5设置环境变量
export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH #有一个坑。nvidia的安装说明中没说要这个,但是你要自己设置。

1.6 卸载命令
NOTE:千万不要顺序执行到这里
sudo apt-get --purge remove cuda
sudo apt autoremove
sudo apt-get clean

2 安装cudnn 6.0
网上各种中文教程,但是nvidia的教程是最权威,又最简单的
http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html。参见2.3.1章节
2.1 下载软件
https://developer.nvidia.com/rdp/cudnn-download

2 安装软件
参考http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html。参见2.3.1章节
Navigate to your <cudnnpath> directory containing the cuDNN Tar file. Unzip the cuDNN package.
$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz
Copy the following files into the CUDA Toolkit directory.
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
/usr/local/cuda/lib64/libcudnn*
3 安装tensorflow-gpu版本
最简单了,直接执行:
pip install tensorflow-gpu
注意1: 墙高无法翻越,需要设置pip源。自行baidu。
注意2:可以指定tensorflow版本 pip install tensorflow-gpu==1.4.1

4 运行测试程序保证安装成功





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值