安装NVIDIA驱动
NVIDIA驱动官网下载对应版本的驱动(runfile版本)
ctrl+alt+f1 进入文本模式下,卸载原有驱动(runfile安装时会卸载掉之前的驱动,可以不用手动去卸载。)
sudo service lightdm stop
sudo apt-get remove –purge nvidia*
如果使用的是apt-get安装可以使用这种方法卸载,如果使用的是runfile,则使用--uninstall命令.
禁用nouveau
- 新建并编辑配置文件:sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
blacklist nouveau blacklist lbm-nouveau options nouveau modeset=0 alias nouveau off alias lbm-nouveau off
- 永久禁用nouveau第三方驱动:sudo update-initramfs -u
- 重启后执行:lsmod | grep nouveau # 没有输出表示屏蔽好了
安装驱动
- 禁用X服务:sudo /etc/init.d/lightdm stop
- 进入命令行界面 Ctrl-Alt+F1
- 在runfile驱动所在文件夹下执行:sudo ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files
- –no-opengl-files 只安装驱动文件,不安装OpenGL文件。这个参数最重要
- –no-x-check 安装驱动时不检查X服务
- –no-nouveau-check 安装驱动时不检查nouveau
- 后面两个参数可不加。
安装CUDA
进入 CUDA版本库 ,选择合适的 CUDA 版本和类型下载。 (推荐使用runfile版本)
安装cuda :sudo sh cuda_9.0.176_384.81_linux.run
a)会先有个阅读声明,按q即可到最后,然后accept
b)第一个选项install nvidia accelerated Graphics Driver (n,因为我们之前安装过了nvidia显卡)
c)第二个选项install the OpenGL libraries 双显卡(指的是集成显卡+独立显卡)选n,单卡(如果没有集成显卡,只有一个或多个支持GPU的显卡)选y。双显卡选y的话,会出现黑屏或登录界面无限循环的问题。
启动图形化界面 sudo service lightdm start,ALT+CTRL+F7返回图形登录界面登录。
配置环境变量
echo 'export PATH=/usr/local/cuda-9.0/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
验证CUDA
nvcc -V #查看版本信息
cd /home/user_name/NVIDIA_CUDA-9.0_Samples
make
cd bin/x86_64/linux/release
./deviceQuery
./bandwidthTest
出现Result = PASS,则表示安装成功。
安装cudnn
若要以conda方式安装caffe2,参考pytorch-nightly/files,到官网下载对应的cuDNN版本,本文以cudnnv7.4.1版本为例。
sudo dpkg -i libcudnn7_7.4.1.5-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.4.1.5-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.4.1.5-1+cuda9.0_amd64.deb
验证cuDNN是否安装成功
cp -r /usr/src/cudnn_samples_v7 $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN
输出配置信息,即表示安装成功。
安装NCCL
下载NCCL:https://developer.nvidia.com/nccl/nccl-legacy-downloads
sudo dpkg -i nccl-repo-ubuntu1604-2.3.7-ga-cuda9.0_1-1_amd64.deb
安装Caffe2
官方教程:https://caffe2.ai/docs/getting-started.html?platform=ubuntu&configuration=prebuilt
安装Detectron
官方教程:https://github.com/facebookresearch/Detectron/blob/master/INSTALL.md
补充:为了避免错误:/lib/utils/cython_nms.so: undefined symbol: PyFPE_jbuf
conda and pip install two numpy, and they conflict. Do install opencv by apt-get or pip way instead of conda. Conda's numpy are not reconginized.
使用apt-get安装opencv:sudo apt-get install python-opencv