远程服务器部署 keras-GPU 排坑记录

这是一篇排坑记录......因为网上好多资料都有坑

  • 部署条件:通过SSH访问的外网服务器,非内网下
  • 操作系统:Ubuntu 16.04
  • 硬件条件:CPU: i7-9700    GPU: GTX-1070    MEM: 16G

 *最大的坑:linux内核版本---NVIDIA驱动版本---CUDA版本---CUDNN版本---Tensorflow-GPU版本---Keras版本 必须要对应

 *一定要换成国内的源,不然速度感人

 

安装 NVIDIA-410 驱动

服务器没有显示屏,所以不需要禁用nouveau,避免了安装失败后重复启动的坑...

1.添加ppa,才能搜索到最新的nvidia驱动

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

2.安装 nvidia-410 驱动

sudo apt-get install nvidia-410

3.查看是否安装成功

nvidia-smi

    有如下输出则证明成功:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.78       Driver Version: 410.78       CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1070    Off  | 00000000:01:00.0  On |                  N/A |
| 47%   42C    P8    14W / 160W |     52MiB /  8118MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1080      G   /usr/lib/xorg/Xorg                            49MiB |
+-----------------------------------------------------------------------------+

安装 CUDA 9.0

有坑,在远程服务器通过各种方法下载很容易断掉,但是在windows下通过迅雷下载速度666...辣么...

1. windows下去NVIDIA官网用迅雷下载

下载地址:   https://developer.nvidia.com/cuda-toolkit-archive

选择runfile文件下载

然后,通过SecureCRT中的Zmodem方法进行远程传输

2.执行安装

sudo ./cuda_9.0.176_384.81_linux.run

*注意: 除了安装NVIDIA驱动的地方选N,其他一路Y

3.在~/.bashrc 的最后面添加环境变量

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
export PATH=$PATH:/usr/local/cuda-9.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0

4.测试是否安装成功

nvcc -V

若有如下输出则成功

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176

 

安装 CuDNN

1.选择对应CUDA-9.0的版本下载

https://developer.nvidia.com/rdp/cudnn-download

2.安装

tar -zxvf cudnn-9.0-linux-x64-v7.1.tgz 
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ 
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d 
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn* 

安装tensorflow-gpu-1.12.0

1.使用pip3安装

pip3 install --upgrade tensorflow-gpu==1.12.0

2.查看是否安装版本\是否安装成功

pip3 list | grep tensorflow

3.坑爹的FutureWarning 警告:

*试过了网上各种降级方法都不靠谱,最后通过如下方法解决

把所有警告的dtype.py中的 np.dtype()中的最后一列 1 改成如下 (1,)

np.dtype([("qint8", np.int8, (1,))])

 

安装 keras

1.安装

pip3 instal keras

2.下载例子

git clone https://github.com/keras-team/keras

3.运行example中的例子

python3 mnist_mlp.py

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值