文章结构
GPU配置
注意:如果只是想进行深度学习框架GPU版本的安装,安装完显卡驱动后,留意下驱动最大支持的CUDA版本,直接跳到Anaconda的安装,不需另外安装CUDA、cuDNN,因为Anaconda中已经自带了该包,conda会自己解决对应的CUDA、cuDNN的依赖的安装。
1.安装NVIDIA显卡驱动
# 1.卸载旧驱动
sudo apt-get remove --purge nvidia*
# 2.禁用nouveau驱动
# 打开文件
sudo gedit /etc/modprobe.d/blacklist.conf
文尾添加内容:
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
options nouveau modeset=0
# 3.更新Linux系统内核
sudo update-initramfs -u
# 4.检查nouveau驱动是否成功被禁,命令无返回则是成功禁用。
lsmod | grep nouveau
# 5.安装驱动.run文件
cd 下载目录
sudo sh NVIDIA-Linux-x86_64-430.40.run -no-x-check -no-nouveau-check -no-opengl-files
我这显卡相比原文就low了些哈哈哈。
PS:动态显示
#GPU显存
watch -n 10 nvidia-smi #每10s更新一次
#CPU、内存
sudo apt-get install htop
htop
留意下对应版本关系,然后转到Anaconda安装
2.CUDA安装
开始之前了解一下版本依赖问题:
2.1显卡驱动版本与CUDA版本的对应关系
2.2tensorflow-gpu版本与cuda版本的对应关系
2.3.开始安装
由nvidia-smi
中信息得知 Drive Version:430.50 最大支持到CUDA:10.1
考虑到之前入过一个坑,9.2的版本装对应的tensorflow-gpu报错,大体意思是缺少9.0版本,我还是装个整数的吧,CUDA10.0嘻嘻嘻。
执行sudo sh cuda_10.0.130_410.48_linux.run
进行安装
PS:驱动事先已经安过了,no
配置环境变量:
打开gedit ~/.bashrc
,文尾追加:
export PATH=/usr/local/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64$LD_LIBRARY_PATH
#export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}}
#export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
更新文件:source .bashrc
之后把自己的cuda环境切到cuda10.0
sudo ln -snf /usr/local/cuda-10.0 /usr/local/cuda
打开系统环境配置文件sudo gedit /etc/profile
文尾追加:
export PATH=/usr/local/cuda/bin:$PATH
保存,然后重启电脑: sudo reboot
测试CUDA的例子:若显示关于GPU的信息,则说明安装成功了
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
创建链接文件 sudo gedit /etc/ld.so.conf.d/cuda.conf
文尾添加:
/usr/local/cuda/lib64
执行 sudo ldconfig
3.cuDNN的安装
解压文件并进入cuda目录:
tar -zxvf cudnn-10.0-linux-x64-v7.4.2.24.tgz
cd cuda/
sudo cp lib64/lib* /usr/local/cuda/lib64/
sudo cp include/cudnn.h /usr/local/cuda/include/
然后更新网络连接:请注意自己的版本号
cd /usr/local/cuda/lib64/
sudo chmod +r libcudnn.so.7.4.2
sudo ln -sf libcudnn.so.7.4.2 libcudnn.so.7
sudo ln -sf libcudnn.so.7 libcudnn.so
sudo ldconfig
测试cuDNN的例子:
下载如下三个文件,并按照程序顺序安装(否则会报错
```python
sudo dpkg -i libcudnn7_7.4.2.24-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.4.2.24-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.4.2.24-1+cuda10.0_amd64.deb
将例子拷到家目录,否则执行会报错
```python
cp -r /usr/src/cudnn_samples_v7/ /home/xu/
cd ~/cudnn_samples_v7/mnistCUDNN/
make clean && make
./mnistCUDNN