ubuntu下搭建深度学习环境
安装Nvidia显卡驱动 、CUDA、cudnn
准备
显卡驱动下载链接:link,选择对应自己的版本。
CUDA下载链接: link
cudnn链接: link , 这个需要注册下载。
我在以下环境测试过,现在各种版本都应该比较好的支持了
测试环境 | 显卡驱动 | CUDA | cudnn |
---|---|---|---|
ubuntu14 + 1080Ti | 384.69 | CUDA8.0 | v5.1 |
ubuntu16 + 1080Ti | 384.69 | CUDA9.0+CUDA10.0 | v7.0 |
ubuntu16 + 2080Ti | 410.48 | CUDA10.0 | v7.5 |
安装Nvidia显卡驱动
方式1
直接在软件和更新安装:
软件和更新 --> 附加驱动 --> 使用NVIDIA binarydriver
方式2
- 屏蔽开源驱动 nouveau
sudo gedit /etc/modprobe.d/blacklist.conf
在配置文件末尾添加 blacklist nouveau 和 blacklist nvidiafb
- 删除旧英伟达驱动
sudo apt-get --purge remove nvidia-*
sudo apt-get --purge remove xserver-xorg-video-nouveau
- 备份修改grub
sudo cp -n /etc/default/grub /etc/default/grub.bak
sudo gedit /etc/default/grub
按照如下内容修改
GRUB_CMDLINE_LINUX = " " --> GRUB_CMDLINE_LINUX = "text"
GRUB_TERMINAL = console
然后更新grub,使更改生效
sudo update-grub
重启电脑
sudo reboot now
- 关闭图形界面(按 Ctrl+ Alt + F1进入command line)
sudo service lightdm stop
- 安装驱动
chmod +x NVIDIA-xxx.run #修改驱动文件的运行权限
sudo sh NVIDIA-xxx.run
安装过程:
如果提示是否接受(accept), 选accept
如果报错The distribution-provided pre-install script failed不用管,继续
提示是否继续,选择continu install
如果提示是否安装新的kernel modules,选no
如果提示32Bit字样,选no
如果提示编译模块,询问是否进行编译,选ok
如果提示将要修改Xorg.conf 选yes
查看驱动版本
sudo dpkg --list | grep nvidia-*
nvidia-smi
重启图形界面
sudo service lightdm start
- 恢复之前更改的设置
sudo mv /etc/default/grub.bak /etc/default/grub
sudo update-grub
sudo reboot
安装CUDA
cuda安装教程的官方链接: link.
注意:为了避免问题,不要选择安装CUDA下的显卡驱动,其他选yes
安装cudnn
解压下载好的cudnn压缩包
tar -xvf cudnn-9.0-linux-x64-v7.tgz
将头文件和链接库拷到相应目录:
sudo cp cuda/include/cudnn.h /usr/local/cuda-9.0/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-9.0/lib64/
sudo chmod a+r /usr/local/cuda-9.0/include/cudnn.h
sudo chmod a+r /usr/local/cuda-9.0/lib64/libcudnn*
安装好cuda和cudnn之后,就可以安装tensorflow pytorch等深度学习框架了。
安装多版本cuda并存
参考:ubuntu16.04安装多个CUDA、cuDNN版本并自由切换link