第一部分cuda9.0
安装cuda
用runfile方式安装cuda
官网下载
- cuda_9.0.103_384.59_linux.run(这个是cuda安装文件)
- cudnn-9.0-linux-x64-v7.solitairetheme8(这个是cudann安装文件,可以理解为cuda下的一个深度学习库)
禁用nouveau
a.注意这步很关键,首先运行
lsmod | grep nouveau
如果终端中有输出,则证明该驱动正在运行,需要手动禁掉nouveau,如果有运行下面命令
sudo vi /etc/modprobe.d/blacklist-nouveau.conf
然后往该文本框中写入
blacklist nouveau
options nouveau modeset=0
b.执行下面语句
sudo update-initramfs -u
c.查看nouveau禁用结果
lsmod | grep nouveau
如果有输出则表明没有禁用成功,多试几次,不过有时候可以尝试重启一下机器或者终端(但不要登录进图形界面)
重启电脑
前面说到不能进入图形界面,在登录窗口,按Ctrl+Alt+F1
进入终端模式,登录你的账户,输入
sudo service lightdm stop
这步关闭了图形化界面,接着切换到cuda安装文件(cuda_9.0.103_384.59_linux.run)的路径,运行
sudo sh cuda_9.0.103_384.59_linux.run # 根据版本号更改
注意:
-
出现声明要看按空格键能快速翻页
-
运行的时候问是否安装openGL,选no
-
其余的时候远东yes输入yes,遇到accept输入accept
安装成功后会显示installed,否则是failed
打开图形化界面
输入
sudo service lightdm start
按Ctrl+Alt+F7
又重回图形界面了,而且分辨率应该也高了很多。
声明环境变量
如果是图形化界面
sudo gedit ~/.bashrc # 终端就换成sudo vi ~/.bashrc
最最后面加上
export PATH=/usr/local/cuda-9.0/binKaTeX parse error: Expected '}', got 'EOF' at end of input: {PATH:+:{PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64KaTeX parse error: Expected '}', got 'EOF' at end of input: …LIBRARY_PATH:+:{LD_LIBRARY_PATH}}
保存退出后
source ~/.bashrc
如果要全局有效,还需要在profile写入
sudo gedit /etc/profile
在这里面也填入
export PATH=/usr/local/cuda-9.0/binKaTeX parse error: Expected '}', got 'EOF' at end of input: {PATH:+:{PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64KaTeX parse error: Expected '}', got 'EOF' at end of input: …LIBRARY_PATH:+:{LD_LIBRARY_PATH}}
安装cudnn
安好了cuda,还需要安装深度学习库cudnn(前面提到的cudnn-9.0-linux-x64-v7.solitairetheme8)才能用Tensorflow-GPU版本。
1.如果之前已经安装了其他错误版本的cudnn,先运行下面两行,否则直接到第2步
sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*
2.修改那个文件的后缀名
cp cudnn-9.0-linux-x64-v7.solitairetheme8 cudnn-9.0-linux-x64-v7.tgz
3.解压这个文件
$ tar -zxvf cudnn-9.0-linux-x64-v7.tgz
cuda/include/cudnn.h
cuda/NVIDIA_SLA_cuDNN_Support.txt
cuda/lib64/libcudnn.so
cuda/lib64/libcudnn.so.7
cuda/lib64/libcudnn.so.7.0.4
cuda/lib64/libcudnn_static.a
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
4.注意这里是7.0.4版本,进入到cuda路径
cd /usr/local/cuda/lib64/
在终端输入下面命令,记得版本号改成自己的,比如上面的7.0.4
$ sudo chmod +r libcudnn.so.7.0.4
$ sudo ln -sf libcudnn.so.7.0.4 libcudnn.so.7
$ sudo ln -sf libcudnn.so.7 libcudnn.so
$ sudo ldconfig
安装Tensorflow-GPU
这个不再赘述,如果自己有虚拟环境建议是安装在虚拟环境中
如果之前安装过Tensorflow CPU版本要先卸载一下
sudo pip uninstall tensorflow
然后安装gpu版本
sudo pip install tensorflow-gpu
之后在终端中输入
python
进入到编辑环境后
import tensorflow as tf
一般没什么问题,自己随便写个程序,会显示GPU信息,证明安装成功了,如果不知道写什么程序,可以复制我前面文章GAN的代码。
第二部分10.1
10.1好像自带显卡驱动的集合了,不用像上面再自己装驱动了
首先下载cuda10.1
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
sudo sh cuda_10.1.243_418.87.00_linux.run
下载cudnn
打开浏览器进到https://developer.nvidia.com/rdp/cudnn-download
下载下面仨
cuDNN Runtime Library for Ubuntu16.04 (Deb)
cuDNN Developer Library for Ubuntu16.04 (Deb)
cuDNN Code Samples and User Guide for Ubuntu16.04 (Deb)
安装cuda10.1
一键式安装
sudo service lightdm stop # 安装驱动需要
chmod 777 cuda_10.1.105_418.39_linux.run
sudo sh cuda_10.1.105_418.39_linux.run
sudo service lightdm start
安装结束后出现
===========
= Summary =
===========
Driver: Installed
Toolkit: Installed in /usr/local/cuda-10.1/
Samples: Installed in /home/hiudawn/, but missing recommended libraries
Please make sure that
- PATH includes /usr/local/cuda-10.1/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-10.1/lib64, or, add /usr/local/cuda-10.1/lib64 to /etc/ld.so.conf and run ldconfig as root
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-10.1/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall
Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-10.1/doc/pdf for detailed information on setting up CUDA.
Logfile is /var/log/cuda-installer.log
意味着要把cuda路径加入环境变量中,可以运行vi ~/.bashrc
写入
export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PATH
搞定后再刷新下source ~/.bashrc
,就可以运行nvcc -V
查看cuda版本了,但接下来还要安装cudnn
安装cudnn
大致运行下面命令就行了,感觉比9.0时候的安装方法nc了不少…
sudo dpkg -i libcudnn7_7.6.3.30-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-dev_7.6.3.30-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-doc_7.6.3.30-1+cuda10.1_amd64.deb