Ubuntu+NVIDIA430.40+CUDA10.0+CUDNN7.6.4+tensorflow-gpu1.13.1+pycharm社区版
注:1.NVIDIA显卡驱动和CUDA工具包本身是不具有捆绑关系的,也不是一一对应的关系,只不过是离线安装的CUDA工具包会默认携带与之匹配的最新的驱动程序。
2. cuDNN是一个SDK,是一个专门用于神经网络的加速包,注意,它跟我们的CUDA没有一一对应的关系,即每一个版本的CUDA可能有好几个版本的cuDNN与之对应,但一般有一个最新版本的cuDNN版本与CUDA对应更好。
一、NVIDIA430.40显卡驱动安装(首先,关闭secure boot=安全启动)
1. 显示gpu显卡驱动列表
nvidia-smi
或者显示显卡信息
nvidia-settings
2.手动去官网下载.run文件,尽量选择对应显卡所推荐的显卡驱动版本
(显卡RTX2060当时的推荐是430.40)
两种卸载方式对应两种安装方式
#for case1: original driver installed by apt-get:
sudo apt-get remove --purge nvidia*
#for case2: original driver installed by runfile:
sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-384.59.run –uninstall
彻底卸载NVIDIA+CUDA+CUDNN所有??
Sudo pat-get autoremove –purge nvidia*
3.禁用nouveau
sudo gedit /etc/modprobe.d/blacklist.conf
文件的最后一行添加blacklist nouveau
执行sudo update-initramfs -u
重启后验证lsmod | grep nouveau无输出
(4)Ubuntu 16.04 Nvidia驱动安装_Stories_Untold的博客-CSDN博客
获取Kernel source(非常重要):
apt-get install linux-source
apt-get install linux-headers-x.x.x-x-generic
不太理解到底重不重要
4.关闭/开启图形界面
sudo service lightdm stop/restart
5.进入命令行界面(4和5看电脑的具体情况,可以反顺序,有些电脑执行完4之后就进不去5了)
Ctrl-Alt+F1
6.下载的.run文件可以放在/home/dzy/download目录下,设置放权
cd download
sudo chmod a+x NVIDIA-Linux-x86_64-430.40.run
7.安装
sudo ./NVIDIA-Linux-x86_64-430.40.run –no-opengl-files
8.涉及到的一些选项(看情况选吧)
9.回到第一步查看gpu信息
二、CUDA10.0安装
首先查看显卡驱动、CUDA、tensorflow三者之间的版本对应关系
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
我的NVIDIA显卡驱动是430.40按理说应该安装CUDA10.1但是我装的10.0,自我感觉tensorflow与CUDA版本对应的严格性>显卡驱动与CUDA之间的版本对应。
1.下载.run文件(1~3G,千万不要下载deb文件,因为deb默认CUDA对应的显卡驱动版本和你预先安装好的不一致的话,会导致前面安装的显卡驱动被卸载)
CUDA Toolkit 10.0 Archive | NVIDIA Developer
sudo chmod +x cuda_10.0.130_410.48_linux.run
sudo sh cuda_10.0.130_410.48_linux.run
安装过程中:不要安装自带的图形加速器(gpu)
2.配置环境
sudo gedit ~/.bashrc
添加安装路径
export PATH=/usr/local/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH}}
注意:CUDA的配置环境不太清楚是什么意思,后面的tensorflowgpu-1.13.1我安装在了/home/venu的虚拟环境中,不清楚将此虚拟环境作为pycharm的解释器的时候能不能调用CUDA。
source ~/.bashrc
3.验证
nvcc -V
或者cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
显示CUDA驱动版本10.1,runtime版本10.0(安装版本)
可能驱动版本需要>运行版本
CUDA的卸载
三、安装CUDNN7.6.4
ubuntu18.04+rtx2060安装cuda10.0+cudnn7+tensorflow-gpu_Draw_1999的博客-CSDN博客
1.去官网下载CUDNN,选择一个支持CUDA10.0的最新版本即可(下载cudnn需要注册NVIDIA账户)
2. 将文件复制到相关路径下
sudo cp cudnn.h /usr/local/cuda/include/
sudo cp lib* /usr/local/cuda/lib64/
3. 动态文件进行链接
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.7 #删除原有动态文件
sudo ln -s libcudnn.so.7.6.4 libcudnn.so.7 #生成软衔接
sudo ln -s libcudnn.so.7 libcudnn.so #生成软链接
四、安装tensorflow-gpu1.13.1
virtualenv --system-site-packages -p python3 ./venv
pip install --upgrade pip
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade tensorflow-gpu==1.13.1
或者迟老师https://blog.csdn.net/gloria_littlechi/article/details/85232781