- 查看当前驱动版本:nvidia-smi,如果失败,则没有安装驱动。
-
禁用nouveau驱动(ubuntu 18.04默认的第三方显卡驱动)
# 其中4.4.0-31-generic视目录中具体情况而定 mv /lib/modules/4.4.0-31-generic/kernel/drivers/gpu/drm/nouveau/nouveau.ko /lib/modules/4.4.0-31-generic/kernel/drivers/gpu/drm/nouveau/nouveau.ko.org update-initramfs -u reboot
-
查看显卡型号和可供安装的驱动版本:ubuntu-drivers devices
-
安装对应版本驱动:sudo apt install nvidia-driver-440
-
中间如果出现设置密码,就设置一下密码即可。重启的时候需要enroll
-
如果模型运行过程中出现NVIDIA-SMI has failed,可以尝试下面步骤恢复
-
sudo apt-get install dkms
-
sudo dkms install -m nvidia -v 410.79
-
如果出现丢失链接库:libGLU.so,libXmu.so则执行sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev;然后重新1,2步骤
-
- 查看TensorFlow,cuda,cudnn对应版本:https://tensorflow.google.cn/install/source
-
下载cuda: https://developer.nvidia.com/cuda-toolkit-archive (Nvidia官网账户:Eureca2020,密码是学号!)
-
sudo sh cuda_10.0.130_410.48_linux.run
- sudo sh cuda_10.0.130.1_linux.run
- 详细步骤可参考cuda安装及版本切换方法
-
-
下载cuDnn:https://developer.nvidia.com/rdp/cudnn-archive
-
下载cuDNN Runtime Library for Ubuntu18.04 (Deb)
-
下载cuDNN Developer Library for Ubuntu18.04 (Deb)
-
下载cuDNN Code Samples and User Guide for Ubuntu18.04 (Deb)
-
安装步骤参考:https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html
- sudo dpkg -i libcudnn7_7.4.2.24-1+cuda10.0_amd64.deb
- sudo dpkg -i libcudnn7-dev_7.4.2.24-1+cuda10.0_amd64.deb
- sudo dpkg -i libcudnn7-doc_7.4.2.24-1+cuda10.0_amd64.deb
-
-
安装GPU版Tensorflow:
-
pip install tensorflow-gpu
-
http://mirrors.aliyun.com/pypi/simple/tensorflow-gpu/
-
查询系统当前python中pip支持安装的包版本: import pip;print(pip.pep425tags.get_supported())
-
例如支持的是tensorflow_gpu-2.0.0rc1-cp36-cp36m-manylinux2010_x86_64.whl
-
将其名字改为tensorflow_gpu-2.0.0rc1-cp36-cp36m-manylinux1_x86_64.whl
-
pip install tensorflow_gpu-2.0.0rc1-cp36-cp36m-manylinux1_x86_64.whl
-
-
-
查看tensorflow是不是GPU版本
from tensorflow.python.client import device_lib print(device_lib.list_local_devices())