实验室配置的是双1080Ti显卡台式机。之前SSD硬盘坏掉了换新的之后,需要重装系统。虽然上次已经装过一次了,但是这次还是遇到很多bug。在这里记录一下供大家参考。
1.ubuntu安装
我是直接用u盘启动盘装的ubuntu18.04,这部分网上有很多教程,就不赘述了。这里关键的是一定要分区,这样未来重装时可以保留HOME的内容,我就是之前没有分区所以导致只能全部消掉。
2.nvidia驱动安装
(1)!!!屏蔽ubuntu自带驱动(重要)
首先创建一个黑名单文件
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
里面写上
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
保存好之后,终端输入
sudo update-initramfs -u
然后再修改一下grub配置,这样可以避免开关机时卡住等情况。之前安装16.04时不修改的话没办法进入图形界面,18.04好像没有这个问题了,但是关机的时候会卡住只能手动强制关机。
sudo vim /etc/default/grub
将里面GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"双引号中间的内容改为
GRUB_CMDLINE_LINUX_DEFAULT="nomodeset acpi=off pci=noacpi"
然后保存,重启电脑。
(2)安装nividia驱动
由于禁用了ubuntu自带的驱动,开机之后图像分辨率会很奇怪,这是正常现象。
先确认一下nouveau驱动是否被禁用,终端输入:
lsmod | grep nouveau
如果没有输出那么说明禁用成功了。
然后按Ctrl+Alt+F3进入tty字符界面(照理说F1,F2,F3等都可以进,但是我习惯进tty3)。首先关闭掉图形化界面
sudo service lightdm stop
有博主说这一步是为了防止图形化界面占用独显而导致驱动安装失败,不过我输入这一行时提示说本来就没开启,所以我就没有管了。
终端输入
ubuntu-drivers devices
可以查看系统的推荐driver,就选择recommended那个就可以了,我的是nivdia-driver-430。
sudo apt install nvidia-driver-430
就安装好了。
终端输入查看显卡信息。
nvidia-smi
如果有输出那就成功了。
如果这时候出现mismatch问题,重启一下就好了。
Failed to initialize NVML: Driver/library version mismatch
3.cuda安装
(1) 准备工作
首先检查一下自己是否装了gcc,kernel header和package development.
终端输入下列语句查看gcc
gcc --version
如果输出这样就说明可以。顺便说一声cuda8.0及以前是不支持gcc5.0版本的,如果想装cuda8.0的话需要降级。
如果没有gcc那就输入下列语句安装
sudo apt install build-essential
然后终端输入下列语句安装kernel header和package development
sudo apt install linux-headers-$(uname -r)
(2)!!!runfile安装(重要)
之前一直使用deb文件安装,导致安装后显示mismatch错误。网上有说重启之后就解决的,但是我重启之后会卡在开机界面没法运行。
后来发现是deb文件安装时会自动安装驱动,所以导致与之前安装的冲突了。
我也试过直接安装cuda不安装驱动,就直接使用deb安装时的驱动,后来还是会出现卡在开机界面没法运行的问题。我觉得是因为cuda安装时选择的驱动太老了,好像是384型号的。但是我在nvidia官网上查询1080Ti是应该使用430型号的驱动。可能是由于这个问题,才导致开机卡住。
在官网上下载好之后。终端输入下列语句安装。
sudo chmod a+x cuda_9.0.176_384.81_linux.run
sudo ./cuda_9.0.176_384.81_linux.run
注意当提示是否安装驱动时一定要选择no。
有博主提到过opengl的安装问题,我这里转述一下。如果用的是集显(图形支持)+独显的话,就不要安装opengl,否则会出现黑屏或login-loop。我的是独显支持图形界面,所以安装也没关系。
安装完就基本大功告成了。
再配置一下环境变量
echo 'export PATH=/usr/local/cuda-9.0/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
安装一下工具包
sudo apt install nvidia-cuda-toolkit
接下来就可以检查一下cuda是否安装成功了。
首先输入nvcc -V可以查看cuda信息
然后试一下小例子
cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv
sudo make
./deviceQueryDrv
输出显卡信息就说明可以了