这是一篇排坑记录......因为网上好多资料都有坑
- 部署条件:通过SSH访问的外网服务器,非内网下
- 操作系统:Ubuntu 16.04
- 硬件条件:CPU: i7-9700 GPU: GTX-1070 MEM: 16G
*最大的坑:linux内核版本---NVIDIA驱动版本---CUDA版本---CUDNN版本---Tensorflow-GPU版本---Keras版本 必须要对应
*一定要换成国内的源,不然速度感人
安装 NVIDIA-410 驱动
服务器没有显示屏,所以不需要禁用nouveau,避免了安装失败后重复启动的坑...
1.添加ppa,才能搜索到最新的nvidia驱动
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
2.安装 nvidia-410 驱动
sudo apt-get install nvidia-410
3.查看是否安装成功
nvidia-smi
有如下输出则证明成功:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.78 Driver Version: 410.78 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 1070 Off | 00000000:01:00.0 On | N/A |
| 47% 42C P8 14W / 160W | 52MiB / 8118MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1080 G /usr/lib/xorg/Xorg 49MiB |
+-----------------------------------------------------------------------------+
安装 CUDA 9.0
有坑,在远程服务器通过各种方法下载很容易断掉,但是在windows下通过迅雷下载速度666...辣么...
1. windows下去NVIDIA官网用迅雷下载
下载地址: https://developer.nvidia.com/cuda-toolkit-archive
选择runfile文件下载
然后,通过SecureCRT中的Zmodem方法进行远程传输
2.执行安装
sudo ./cuda_9.0.176_384.81_linux.run
*注意: 除了安装NVIDIA驱动的地方选N,其他一路Y
3.在~/.bashrc 的最后面添加环境变量
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
export PATH=$PATH:/usr/local/cuda-9.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0
4.测试是否安装成功
nvcc -V
若有如下输出则成功
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176
安装 CuDNN
1.选择对应CUDA-9.0的版本下载
https://developer.nvidia.com/rdp/cudnn-download
2.安装
tar -zxvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
安装tensorflow-gpu-1.12.0
1.使用pip3安装
pip3 install --upgrade tensorflow-gpu==1.12.0
2.查看是否安装版本\是否安装成功
pip3 list | grep tensorflow
3.坑爹的FutureWarning 警告:
*试过了网上各种降级方法都不靠谱,最后通过如下方法解决
把所有警告的dtype.py中的 np.dtype()中的最后一列 1 改成如下 (1,)
np.dtype([("qint8", np.int8, (1,))])
安装 keras
1.安装
pip3 instal keras
2.下载例子
git clone https://github.com/keras-team/keras
3.运行example中的例子
python3 mnist_mlp.py