前言: 一开始我们实验室尝试用deb安装包的方法安装NVIDIA Tesla P100对应的显卡驱动和CUDA,但是总是出现重复登录的问题,迫不得已我们最后采用比较繁琐的用run文件安装显卡驱动和CUDA的方法。(还是建议先用deb文件安装一下试试,因为比较简便。)
首先明确一下,我没有安装NVIDIA驱动程序。我改为运行了cuda.run文件,并在提示我时安装了NVIDIA驱动程序。
1)下载相关CUDA.run文件。
2)安装前准备
$ sudo apt-get update
$ sudo apt-get install build-essential
3)无需创建xorg.conf文件。如果你有一个,删除它(假设你安装了新的操作系统)。
$ sudo rm /etc/X11/xorg.conf
4)屏蔽系统自带的显卡驱动nouveau
新建blacklist-nouveau.conf文件,输入命令:
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
往文件中写入:
blacklist nouveau
options nouveau modeset=0
保存并退出。这一步是为了禁掉Ubuntu自带开源驱动nouveau。
然后执行命令:
sudo update-initramfs -u
接下来需要重启,输入reboot命令,重启后执行:
lsmod | grep nouveau
查看nouveau模块是否被加载。如果什么都没输出,则已成功禁用。
5)使用下面命令禁用X server
sudo service lightdm stop
会出现黑屏,然后同时按:Ctrl + Alt + F1,然后输入用户名和密码。
6)转到您拥有CUDA驱动程序的目录,然后运行
$ chmod a+x cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
7)现在,运行命令进行安装,请注意,我明确不希望安装OpenGL标志:
$ sudo bash cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb --no-opengl-libs
8)我的会出现以下问题,如果您的没有问题,可跳过这一步。
Installing the NVIDIA display driver... The driver installation is unable to locate the kernel source. Please make sure that the kernel source packages are installed and set up correctly.
If you know that the kernel source packages are installed and set up correctly, you may pass the location of the kernel source w