在ubuntu16.04服务器上安装tensorflow(GPU支持)

最新推荐文章于 2023-11-01 11:30:37 发布

caicai0352

最新推荐文章于 2023-11-01 11:30:37 发布

阅读量1k

点赞数 2

本文链接：https://blog.csdn.net/weixin_40113498/article/details/82969317

版权

在ubuntu16.04服务器上安装tensorflow(GPU支持)

ubuntu16.04+CUDA Toolkit 9.0+cudnn7.0.5+tensorflow-gpu1.9.0+Anaconda3+python3.6

参考教程

采用Anaconda的方式安装

下载anaconda linux版本适用于python3.6

wget -c https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh

安装anaconda

bash Anaconda3-5.0.1-Linux-x86_64.sh

建立一个 conda 计算环境名字叫tensorflow:（anaconda3/envs/tensorflow文件夹中）

# Python 3.6
$ conda create -n tensorflow python=3.6

建立环境后会有激活命令和关闭命令提示

# To activate this environment, use:
# > source activate tensorflow
#
# To deactivate an active environment, use:
# > source deactivate

这里转到启用GPU支持处，安装CUDA Toolkit 9.0 和 cuDNN v7.0.5 之后完成以下步骤。

接下来需要设置 Anaconda
激活tensorflow环境

source activate tensorflow

使用其中的 pip 安装
版本信息tensorflow_gpu_1.9.0

(tensorflow)$ pip install tensorflow-gpu==1.9.0

启用 GPU 支持

CUDA(Compute Unified Device Architecture)，是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA™架构编写程序，C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。

安装

安装CUDA Toolkit9.0

确定GPU类型。
cuda官网下载 cuda toolkit 9.0

下载linux-x86_64-ubuntu-16.04-runfile(local)的Base Installer

使用runfile安装。
安装过程

sudo sh cuda_9.0.176_384.81_linux.run

输入accept回车，之后 y以及defult即可。
安装后尝试例子和修改环境变量。

配置文件

打开~/.bashrc文件：
sudo vim ~/.bashrc
将以下内容写入到~/.bashrc尾部：

export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

测试CUDA的samples

cd  /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

如果显示一些关于GPU的信息，则说明安装成功。

配置cuDNN

cuDNN是GPU加速计算深层神经网络的库。
首先去官网(https://developer.nvidia.com/rdp/cudnn-download)下载cuDNN,可能需要注册一个账号才能下载。

下载

Download cuDNN v7.0.5 , for CUDA 9.0

下载cuDNN v7.0.5 Library for Linux
版本

（下载解压后会有文件夹cuda，使用操作3中的命令进行文件迁移就好了，操作完成就可以，下面是三步操作）

1.Navigate to your directory containing the cuDNN Tar file.下载
2.Unzip the cuDNN package.解压

$ tar -xzvf cudnn-9.0-linux-x64-v7.0.5.solitairetheme8

3.Copy the following files into the CUDA Toolkit directory.


$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include ##复制
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64  ##复制
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

安装cuda时问题

1.无法进入桌面you appear to be running an x server please exit x before installing

2.卸载cuda

3.nvidia-smi 命令解读

4.cuda:Missing recommended library: libGLU.so,libX11.so,libXi.so,libXmu.so

5.卸载tensorflow-gpu命令

(tensorflow) root@cc:/usr# pip uninstall tensorflow-gpu

卸载后直接用pip安装想要更新的版本即可

6.安装过程中很多版本不兼容的问题。

cuda driver版本越高越好，向下兼容。
CUDA Toolkit 9.0比较合适
TensorFlow1.3，TensorFlow1.4均默认寻找cudnn6.0
TensorFlow1.8,1.9，寻找cudnn7.0以及CUDA Toolkit9.0

7.libcudnn.so.6:cannot open sharedobjectfile: No such file or directory

安装Bazel（不需要）

使用方法一:Using Bazel custom APT repository (recommended)

安装其他依赖

# For Python 2.7:
$ sudo apt-get install python-numpy swig python-dev python-wheel
# For Python 3.x:
$ sudo apt-get install python3-numpy swig python3-dev python3-wheel