在ubuntu16.04服务器上安装tensorflow(GPU支持)
ubuntu16.04+CUDA Toolkit 9.0+cudnn7.0.5+tensorflow-gpu1.9.0+Anaconda3+python3.6
采用Anaconda的方式安装
下载anaconda linux版本 适用于python3.6
wget -c https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh
bash Anaconda3-5.0.1-Linux-x86_64.sh
建立一个 conda 计算环境名字叫tensorflow:(anaconda3/envs/tensorflow文件夹中)
# Python 3.6
$ conda create -n tensorflow python=3.6
建立环境后会有 激活命令和关闭命令提示
# To activate this environment, use:
# > source activate tensorflow
#
# To deactivate an active environment, use:
# > source deactivate
这里转到启用GPU支持处,安装CUDA Toolkit 9.0 和 cuDNN v7.0.5 之后完成以下步骤。
接下来需要设置 Anaconda
激活tensorflow环境
source activate tensorflow
使用其中的 pip 安装
版本信息tensorflow_gpu_1.9.0
(tensorflow)$ pip install tensorflow-gpu==1.9.0
启用 GPU 支持
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。
安装
安装CUDA Toolkit9.0
确定GPU类型。
cuda官网下载 cuda toolkit 9.0
下载linux-x86_64-ubuntu-16.04-runfile(local)的Base Installer
使用runfile安装。
安装过程
sudo sh cuda_9.0.176_384.81_linux.run
输入accept回车,之后 y以及defult即可。
安装后尝试例子和修改环境变量。
配置文件
打开~/.bashrc文件:
sudo vim ~/.bashrc
将以下内容写入到~/.bashrc尾部:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
测试CUDA的samples
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
如果显示一些关于GPU的信息,则说明安装成功。
配置cuDNN
cuDNN是GPU加速计算深层神经网络的库。
首先去官网(https://developer.nvidia.com/rdp/cudnn-download)下载cuDNN,可能需要注册一个账号才能下载。
Download cuDNN v7.0.5 , for CUDA 9.0
下载cuDNN v7.0.5 Library for Linux
版本
(下载解压后会有文件夹cuda,使用操作3中的命令进行文件迁移就好了,操作完成就可以,下面是三步操作)
1.Navigate to your directory containing the cuDNN Tar file.下载
2.Unzip the cuDNN package.解压
$ tar -xzvf cudnn-9.0-linux-x64-v7.0.5.solitairetheme8
3.Copy the following files into the CUDA Toolkit directory.
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include ##复制
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 ##复制
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
安装cuda时问题
1.无法进入桌面you appear to be running an x server please exit x before installing
2.卸载cuda
3.nvidia-smi 命令解读
4.cuda:Missing recommended library: libGLU.so,libX11.so,libXi.so,libXmu.so
5.卸载tensorflow-gpu命令
(tensorflow) root@cc:/usr# pip uninstall tensorflow-gpu
卸载后直接用pip安装想要更新的版本即可
6.安装过程中很多版本不兼容的问题。
-
cuda driver版本越高越好,向下兼容。
-
CUDA Toolkit 9.0比较合适
-
TensorFlow1.3,TensorFlow1.4均默认寻找cudnn6.0
-
TensorFlow1.8,1.9,寻找cudnn7.0以及CUDA Toolkit9.0
7.libcudnn.so.6:cannot open sharedobjectfile: No such file or directory
安装Bazel(不需要)
使用方法一:Using Bazel custom APT repository (recommended)
安装其他依赖
# For Python 2.7:
$ sudo apt-get install python-numpy swig python-dev python-wheel
# For Python 3.x:
$ sudo apt-get install python3-numpy swig python3-dev python3-wheel