tensorflow环境搭建_Ubuntu 16.04搭建深度学习环境的超级无敌详细教程

Ubuntu 16.04搭建深度学习环境

前言

    Linux服务器上的环境没有共用,要在自己文件夹搭建所需要的环境。要安装的有:Anaconda3、TensorFlow、Pytorch,这几个都是直接或间接的有版本对应关系。顺便记录一下安装过程,本来搭环境就很烦,以后在新机器搭环境就不用东找西找。

版本对应关系

    由于要在服务器上跑bert,源码是tensorflow 1.x版本的,bert配置要求:

                    CPU版本:tensorflow >= 1.11.0

                    GPU版本:tensorflow-gpu >= 1.11.0

    至于安装哪个版本的tensorflow-gpu和pytorch,需要看CUDA版本,查看CUDA版本有多种方式:

nvidia-smi

ff89fe81b69f53c8d1677a99bc5d0517.png

nvcc -V

8ac15dbb400efa0a84591319f5e07bfc.png

    两种方法查到的CUDA版本不一样:nvidia-smi查到的CUDA版本是10.2,而nvcc -V查到的CUDA版本是9.0。这里查到的分别是驱动版本(10.2)和运行版本(9.0),一般来说驱动版本>驱动版本即可,除非要用tensorflow 2.x版本,就要安装CUDA 10.0或更高版本。

    后面根据运行版本来选择对应tensorflow和pytorch版本,即用以下命令查看CUDA版本

nvcc -V

    除了CUDA版本,还有cuDNN版本,查看cuDNN版本

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

a7b11015d9c24fd526f0611964257172.png

    查到的cuDNN版本为7

    Linux系统的tensorflow-gpu、CUDA和cuDNN版本对应关系如下

60ca5663855d6432996a45bbf287d504.png

    根据CUDA和cuDNN版本可以确定tensorflow-gpu 1.11.0 和1.12.0版本是可用的,因此需要搭建环境如下

e1a0450275ce30fc612b86f5aa911042.png

    上面的Anaconda3-5.0.0对应python版本为3.6.2,按表中顺序来安装。

Anaconda3下载与安装

1 下载

    Anaconda和python版本是对应的(后面也可以自己创建其他版本的环境),我这边要跑BERT,要求tensorflow-gpu>=1.11.0,对应python版本为3.3-3.6。

    现在由于上传/下载文件比较麻烦,直接用wget来下载Anaconda,不带参数是默认下载到当前文件夹的,下载到指定文件夹用-P。

wget https://repo.anaconda.com/archive/Anaconda3-5.0.0-Linux-x86_64.sh

531bdce60a84d343e353c059541ed3f8.png

    到此为止已经下载好了。

2 安装

    进入刚下好的Anaconda3-5.0.0-Linux-x86_64.sh所在目录,输入

bash Anaconda3-5.0.0-Linux-x86_64.sh

f63d45bdd72a7bcbde3cb5eadb34d6dc.png

    回车后出现以下界面,下面有个--More--,一直回车就可以,直到最后显示完协议出现下面提示,是否同意许可。

b5e61c10dc9c4b039bec286af994eb52.png

    输入yes,回车。

08f7fff2060a5a61314c291cc5305a2f.png

    继续回车,使用默认安装目录,开始安装。

9eafaee3977321d7c22d00d148ee8db9.png

    安装完之后提示是否把Anaconda的bin目录添加到用户环境变量中,输入yes,回车。这样就安装完了,接下来检查是否安装成功,输入

conda --version

显示出conda的版本信息,说明环境变量已经配置好了。

5bd5f8a9642d05e1a0033e7f82597da9.png

    PS:如果提示 conda: command not found,先尝试重新打开powershell再输入conda --version,还是不行的话就vi ~/.bashrc,在最后面自己添加bin的目录。

    查看python的安装路径,输入

which python

8fa5f451461d641445cc87f42b7e939b.png

    Anaconda3安装完毕。

tensorflow下载与安装

1 下载

    跟Anaconda一样用wget下载,输入

wget https://mirrors.tuna.tsinghua.edu.cn/pypi/web/packages/25/52/01438b81806765936eee690709edc2a975472c4e9d8d465a01840869c691/tensorflow_gpu-1.11.0-cp36-cp36m-manylinux1_x86_64.whl#sha256=6a8cd775cc7dad465e3b73da0574f20d3ea345ac3586217296c7de50ecc097fb

f7a29744c629ebda12af6cfd050f6b92.png

2 安装

    进入tensorflow-gpu 1.11.0 wheel文件所在目录,用pip安装wheel文件。

pip install tensorflow_gpu-1.11.0-cp36-cp36m-manylinux1_x86_64.whl

82450edf3f3fff696f2037c219c85c78.png

    安装过程发生错误:Failed building wheel for grpcio

81a1be8a9f3594cfa42a8236e783d8cb.png

    解决办法:自行安装grpcio,直接输入

pip install grpcio==1.9.1

1516c676740b12cb67a012cd29f8050d.png

    安装完成,继续安装tensorflow

pip install tensorflow_gpu-1.11.0-cp36-cp36m-manylinux1_x86_64.whl

d7db6bbb1a3ccdccb5544b8c06f77535.png

    没有报错了,安装完成,接下来验证是否安装成功。

    进入python

python

    首先检查tensorflow是否可以导入

import tensorflow as tf
tf.__version__ # 查看tensorflow版本

    输出的tensorflow版本为:'1.11.0'

6eb9c24c375ab67b363241d4f572c3a1.png

    然后检查GPU是否可用,输入

print(tf.test.is_gpu_available())

5aa0478de4b4a49ef690a3823d3c4251.png

    结果为True说明GPU可用,然后检查CUDA是否可用,输入

print(tf.test.is_built_with_cuda())

6dff20cac6bf12d957d83d8eedd980df.png

    结果为True说明CUDA可用。

    这就是tensorflow-gpu 1.11.0的安装过程。

pytorch下载与安装

1 下载

    使用pytorch要同时安装torch和torchvision,两者版本是对应的。

    下载torch 1.1.0

wget http://download.pytorch.org/whl/cu90/torch-1.1.0-cp36-cp36m-linux_x86_64.whl

    下载torchvision 0.3.0

wget https://download.pytorch.org/whl/cu90/torchvision-0.3.0-cp36-cp36m-manylinux1_x86_64.whl

ce8921c5c2d1fc1c70eae5bd48122088.png

2 安装

    进入torch 1.1.0 wheel文件所在目录,用pip安装wheel文件。

    安装torch 1.1.0

pip install torch-1.1.0-cp36-cp36m-linux_x86_64.whl

    安装torchvision 0.3.0

pip install torchvision-0.3.0-cp36-cp36m-manylinux1_x86_64.whl

eb7ce923624c3c7643ec1551bd264fc9.png

    接下来检查pytorch是否成功安装,进入python

python

    检查是否可以导入torch和torchvision,以及GPU是否可用

import torch
import torchvision
torch.cuda.is_available() # 检查GPU是否可用

10f8d70f94868c485d01e48667314aab.png

    成功导入torch和torchvision,结果为True,GPU可用。

搞掂

    在Ubuntu 16.04上搭建深度学习环境已经完成,总的来说还算比较顺利,接下来就可以愉快地建(diao)模(bao)了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值