Ubuntu16.04配置GPU驱动(GTX1060)+ CUDA9.0 + CUDNN7.0.5

1.查看电脑是否有一个可以支持CUDA的GPU

a.在终端输入命令行(ctrl+alt+T快捷进入终端):

$ lspci | grep -i nvidia

查看电脑GPU信息如下:
在这里插入图片描述

b.在终端输入命令行:

$ uname -m && cat /etc/*release

验证自己的Linux系统是否支持CUDA:
Ubuntu16.04支持,系统信息如下:

在这里插入图片描述

c.在终端输入命令行:

gcc --version

在这里插入图片描述

如果显示未安装,则使用如下命令行进行安装:

sudo apt-get install build-essential

d .在终端输入:

$ uname -r

e.进一步在终端输入:

$ sudo apt-get install linux-headers-$(uname -r)

可以安装对应 kernel 版本的 kernel header 和 package development

若以上各项检查均满足要求,便可以进行下面的正式安装过程!

2.安装 NVIDIA 驱动

(1)运行.run文件的方式

步骤如下:
a. 从NVIDIA驱动官网查找电脑的显卡型号然后下载相应的驱动,然后把下载好的文件移动到Home文件夹下,便于后续终端的操作,因为终端默认在Home文件夹下开启,我的电脑型号和驱动信息如下:
在这里插入图片描述
在这里插入图片描述

b. 禁止集成的 nouveau驱动:ubuntu系统集成显卡的驱动程序是nouveau,它是第三方为NVIDIA开发的开源驱动,我们需要先将其屏蔽才能安装NVIDIA官方驱动。将驱动添加到黑名单blacklist.conf中,但是由于该文件属性不允许修改,所以需要先修改文件属性。

修改属性命令:

$ sudo chmod 666 /etc/modprobe.d/blacklist.conf

用 gedit编辑器 打开 blacklist.conf

sudo gedit /etc/modprobe.d/blacklist.conf

在该文件后添加几行:

    blacklist vga16fb 
    blacklist nouveau 
    blacklist rivafb
    blacklist rivatv 
    blacklist nvidiafb

保存退出文档编辑器

执行如下命令,更新系统,来禁用 nouveau

sudo update-initramfs -u 

重启电脑,命令如下:

sudo reboot

重启成功后,在终端输入如下命令检查是否禁用 nouveau 成功,无输出,表示成功。这里强调必须是无任何输出才算成功;有的博客里采用其他方法禁用 nouveau,本人尝试后发现不能起到禁用效果,这里只给出对应链接,不做进一步展示;而对于笔者介绍的方法,如果不能起到禁用效果,则可以参考这篇博客,由于本人没有遇到这个问题,希望遇到问题的同学可以借鉴。

c. 按 ctrl+alt+f1 进入文本命令行界面
(按 ctrl + alt + f7 退出界面,进入界面之后先登录,login是指ubuntu系统的用户名,password是指用户名对应的密码,如果密码中有数字,不要使用数字小键盘进行输入,不然会显示密码错误!)

进入命令行后,执行以下命令,关闭图形界面(不执行后面会出错):

sudo service lightdm stop

卸载掉原有驱动:
(若安装过其他版本或其他方式安装过驱动执行此项)

 sudo apt-get remove nvidia-* 

给驱动 run 文件赋予执行权限:

sudo chmod  a+x NVIDIA-Linux-x86_64-450.80.02.run

安装:

sudo ./NVIDIA-Linux-x86_64-450.80.02.run -no-opengl-files

只有禁用 opengl 这样安装才不会出现循环登录的问题

也有执行如下操作的:

sudo ./NVIDIA-Linux-x86_64-450.80.02.run -no-x-check -no-nouveau-check -no-opengl-files

但是可能会出错,需要具体情况具体分析;

# 说明
-no-x-check:安装驱动时关闭X服务
-no-nouveau-check:安装驱动时禁用nouveau
-no-opengl-files:只安装驱动文件,不安装OpenGL文件

安装过程中的选项:
由于本人在使用该方案时出现了错误,因此后面的安装经验转自这篇博客,此外,本人的报错情况如下图,因此就换了接下来的第二种安装方案;
在这里插入图片描述

(2)ppa 源的安装方式

a.禁止集成的 nouveau 驱动,方法同方案一,不再赘述。

b.卸载旧的驱动并添加源

sudo apt-get remove --purge nvidia-*

添加源:

sudo add-apt-repository ppa:graphics-drivers/ppa

按 enter 键添加;

更新源:

sudo apt-get update

寻找合适的驱动版本:

ubuntu-drivers devices

在这里插入图片描述

安装 NVIDIA driver
如上图显示 GTX1060显卡 建议的驱动版本是 430

c.按 ctrl+alt+f1 进入命令行界面

在命令行界面下输入如下命令,关闭图形界面,不执行后面会出错:

sudo service lightdm stop

卸载掉原有的驱动:

 sudo apt-get remove nvidia-* 

d. 安装并重新启动图形环境

sudo apt-get install nvidia-430

重新启动图形环境:

sudo service lightdm start

重启电脑:

sudo reboot

e.查看是否安装成功:

nvidia-smi

若安装成功,则如下图所示:
在这里插入图片描述

(3)系统设置中安装方式

见博客:系统安装驱动
不推荐使用,因为只能安装最新版的驱动。
至此,NVIDIA独立显卡驱动安装完毕!

3.安装 CUDA9.0

a.官网下载cuda9.0
选择方式如下图:

在这里插入图片描述
其中,要下载的内容包括 cuda工具包 和 4个补丁,为了避免出错,建议全部下载下来,不用接外网,校园网就很快,所有内容移动到Home文件夹下,便于后面使用终端直接进行操作,内容如下图所示:

在这里插入图片描述
b. 首先安装cuda工具包,之后才可以安装补丁;直接打开终端,输入如下指令,进行cuda工具包的安装:

sudo sh cuda_9.0.176_384.81_linux.run 

(1)按q键跳过安装须知,输入accept接受。
(2)问你驱动装不装,输入n,选择不装,上面装过了。
(3)问你CUDA装不装,输入y,选择安装。回车键安装在默认位置(也可以自己选择位置安装)。
(4)问你要不要创建链接,输入y,选择创建。
(5)问你sample装不装,因为我们只是调用CUDA,不去写CUDA程序,输入n,选择不安装。

c. 添加路径库以及打补丁:

打开bashrc:

sudo vim ~/.bashrc

添加路径,可以加注释以便识别:

# 随便写点啥表示你自己写的不是电脑加的,删除的时候好识别
export PATH="/usr/local/cuda-9.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH"

使之生效:

source .bashrc

使用命令echo $PATHecho $LD_LIBRARY_PATH查询是否添加成功,运行结果如下:
在这里插入图片描述
初次运行的时候不会出现没有那个文件和目录,不需要太在意。

打补丁:

像cuda9.0和cuda9.1都是有补丁的,打补丁很快(和安装cuda一样,不过简化很多):

sudo sh cuda_9.0.176.1_linux.run
sudo sh cuda_9.0.176.2_linux.run
sudo sh cuda_9.0.176.3_linux.run
sudo sh cuda_9.0.176.4_linux.run

按q退出协议,输入accept,再直接回车即可,每个补丁都如此。

d.验证:
查看nvcc编译器版本以确认cuda版本:

$ nvcc --version

在这里插入图片描述
最后一行表示cuda已经是9.0了。接着编译并运行示例代码,进入相应示例代码目录:

$ cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery

编译并运行:

$ make -j # 如果报错就使用 sudo make-j
$ ./deviceQuery

运行结果如下:
在这里插入图片描述
最后的PASS表示程序测试通过,前面已经安装过驱动,因此在安装 cuda9.0 的时候不需要再安装驱动了!

4. 安装cuDNN7.0.5

a.官网下载cudnn7.0.5,需要注册一个新用户才可以。

需要下载的内容有如下几条:
cuDNN v7.6.0 Runtime Library for Ubuntu16.04 (Deb)
cuDNN v7.6.0 Develpoper Library for Ubuntu16.04 (Deb)
cuDNN v7.6.0 Code Samples and User Guide for Ubuntu16.04 (Deb)
cuDNN v7.0.5 Library for Linux

最后一个是必须下载的前三个是为了测试用,可以选择不下载,但一般还是要下载的,如图:
在这里插入图片描述
b. cd到下载路径解压文件:

tar -xzvf cudnn-9.0-linux-x64-v7.tgz

c. 安装cudnn

cd cuda  
sudo cp include/cudnn.h /usr/local/cuda/include/   
sudo cp lib64/*  /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
 
 
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.7
sudo ln -s libcudnn.so.7.6.0 libcudnn.so.7
sudo ln -s libcudnn.so.7 libcudnn.so 
sudo ldconfig

其中里面的这些文件要根据自己的实际情况来确定

d. 进行cudnn的测试:

cd 到下载 deb 文件的目录下进行终端操作:

    sudo dpkg -i libcudnn7_7.6.0.64-1+cuda10.0_amd64.deb
    sudo dpkg -i libcudnn7-dev_7.6.0.64-1+cuda10.0_amd64.deb
    sudo dpkg -i libcudnn7-doc_7.6.0.64-1+cuda10.0_amd64.deb

如果发生以下错误,则重新下载deb文件,再执行上面相关的命令行即可;

在这里插入图片描述
进行测试:

cp -r /usr/src/cudnn_samples_v7/ /home/wdong/
cd /home/wdong/cudnn_samples_v7/mnistCUDNN
make clean && make # 或者 sudo make clean && sudo make
./mnistCUDNN

测试结果如图:
在这里插入图片描述

说明cuDNN7.0.5安装成功,至此,cuda环境配置完毕,可以使用anaconda进行各种框架下gpu的配置了!

5.参考博客:

测试cudnn
nvidia cuda工具包更新9.0版本记录
Ubuntu 16.04 上安装 CUDA 9.0 详细教程
Ubuntu16.04安装NVIDIA驱动+CUDA9.0+cuDNN7.0
Ubuntu16.04 nvidia 显卡驱动过程及遇到的问题
ubuntu16.04下NVIDIA GTX965M显卡驱动PPA安装

6.安装Pytorch

虚拟环境需要自己创建,基于conda;
由于 cuda9.0 对应的 Pytorch 版本属于旧版本,因此需要在Pytorch官网进行下载;
本人下载的版本是 Pytorch1.1.0,如下图所示:
在这里插入图片描述
本人使用 conda 指令安装 ,安装截图如下:

在这里插入图片描述
可以发现,pytorch-1.1.0 和 torchvision-0.3.0 均没有国内的源,因此需要的时间比较长,耐心等待即可安装完毕,或者可以使用 wheel 提前下载,再 cd 到该目录下,使用 conda 或者 pip 安装即可,这种安装方式速度比较快!

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值