Ubuntu下安装cuda,cudnn和pytorch

服务器配置

公司新配了几台2080TI主机打算做分布式训练,我事先以安装好Anaconda和pycharm了,这2个安装不难去官网下载对应安装就行了,下面主要记录cuda10.1、cudnn7.6和torch1.6的安装。至于为啥是这些,是因为要跑yolov5啊。。。

cuda和cudnn安装

新安装的Ubuntu系统,显卡一些驱动并没有正确的设置好,所以在安装之前需要调整一下

  1. 在终端输入nvidia-smi 提示未安装驱动,并在下方给出几个驱动版本推荐安装,这里我们直接退出终端
  2. 打开‘系统设置’–>‘软件和更新’–>‘附加驱动’–>选择第一个驱动

网上找的图,当时忘记截图了,这里示意一下
忘记截图了,网上找了一张大概示意一下。
当然还有其他方式安装驱动,这里我偷个懒,点击‘应用更改 ’,然后等待下载安装,完成后重启。

3.重启后终端输入‘nvidia-smi’应该有显卡信息了,还没有自行百度对应解决,这里不多赘述。这一步配置anaconda镜像源。
打开https://mirror.tuna.tsinghua.edu.cn/help/anaconda/ 这个网站复制下面代码
在这里插入图片描述
在终端输入gedit .condarc 回车,在弹出的文本页面中将页面清空并将上述代码粘贴其中,保存退出。
接着输入 conda clean -i 来清除索引缓存,保证用的是镜像站提供的索引。

4.安装cuda和cudnn 终端输入‘conda install python cudatoolkit=10.1 cudnn=7.6
5.安装torch和torchvision 终端输入‘conda install pytorch torchvision -c pytorch’ 我现在安装的是最新版所以没有带上版本号,不是最新的自己要带上版本。
6.安装完成后终端验证,进入python环境,‘import torch'torch.cuda.is_available()',输出是True即成功。可以在输入‘torch.rand(4,4).cuda()’自己看下。

在安装一台电脑时候,遇到'torch.cuda.is_available()’,输出是False的情况。

上图
在这里插入图片描述

在这里插入图片描述
打算移除nvidia_uvm重新加载模块的,结果发现并没有正确的加载。。。。
lsmod | grep nvidia 查询一看确实没有
在这里插入图片描述
重新sudo modprobe nvidia_uvm加载,再次查看有了
在这里插入图片描述
最后验证一下:
在这里插入图片描述
发现cuda已正确调用,重启再运行此代码正常调用。至此配置结束。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值