linux重启gpu_远程配置Ubuntu深度学习服务器GPU驱动+Docker+CUDA多个版本

前言

    首先说一下为什么建议使用docker来使用搭建深度学习服务器。其实网上很多人都写了如何搭建CUDA10.0 + cudnn8.5 , CUDA9.0 + cudnn7.5 等等,并且从TensorFlow的官网你还可以了解到,不同版本的CUDA只能使用指定的几个TensorFlow版本(Pytorch更是只能下载指定CUDA版本的库),特别是在多个人同时使用的环境下,远程的深度学习服务器经常会崩掉,有可能是别人装了其他版本的CUDA,或者说有人想使用更高版本的CUDA就升级了GPU驱动,结果升级失败;还有可能是你自己想要用其他版本的深度学习框架来复现前人的code,结果发现要换个版本好难,甚至换个版本又把linux内核都升级了,恭喜你难受升级了。

    因此,本文的目的就是为了让大家能够快速的从这种难受走出来,直接使用docker这个及其优美的工具来搭建深度学习服务器,你会发现,yyds啊。

    首先,当然是安装GPU驱动了,本人使用的是学校的远程ubuntu系统,因此直接上手远程配置,如果是ubuntu桌面版的话,基本操作一样,在终端运行下面的代码就行。下面介绍两种安装方式:

一、安装NVIDIA驱动

1. 直接安装

    这种安装方式会比较快,但是很多不是刚装的系统会很难一次性装上,我之前也是有很多次部署GPU驱动都没办法用这种方式安装上,因此,建议刚装上的系统可以直接使用这个方法,只要源没有问题,基本上就可以,如果使用这种方法无法装上,那么就卸载了之后重新手动安装。

1.1 查看显卡对应的驱动型号

在终端输入:

ubuntu-drivers devices

然后系统会花一定时间来检测你的对应驱动型号(要等一下才会出来):

20f23362b2353cc672f8dae0f05284bf.png

    这里看到系统推荐我安装的是460的型号,我们可以直接按照系统推荐的安装,也可以自己自己安装自己想要的几个版本,只要上面图片中展示了的都行。

1.2 开始安装驱动

按照推荐安装的代码:

sudo ubuntu-drivers autoinstall

安装自己制定的版本(不是很推荐):

sudo apt install nvidia-*

*号代表你选择的型号,比如450,440

1.3 检验安装结果

上述安装完毕之后需要重启电脑:

sudo reboot

重启之后,我们可以直接在终端输入:

nvidia-smi

如果出现以下界面,那么恭喜你,驱动安装成功了:

b5f70c1cad3e49ab42ca122bf795f282.png

2. 手动安装

2.1 查询显卡型号

    首先就是按照自己的GPU版本去NVIDIA官网下载对应的驱动,如果不知道远程的电脑是什么型号的话,可以输入下面代码查询显卡的PCI设备号:

lshw -numeric -C display

71bf0b83f9b62d4df72a1bb5e0939b6f.png

    查到自己的版本号之后 ,查看PCI对应显卡型号:http://pci-ids.ucw.cz/mods/PC/10de?action=help?help=pci ,输入我上面画红圈的部分,就可以直接查询了:

945153d3ac309d41249482b6281aeb1b.png

我的是RTX 2080 Ti

2.2 下载对应驱动

官网地址:https://www.nvidia.cn/Download/index.aspx?lang=cn

点击进去之后就是这个界面:

b9d5acc4137db8f5154586b160a9e701.png

    接下来

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值