Ubuntu下安装cuda,cudnn和pytorch
服务器配置
公司新配了几台2080TI主机打算做分布式训练,我事先以安装好Anaconda和pycharm了,这2个安装不难去官网下载对应安装就行了,下面主要记录cuda10.1、cudnn7.6和torch1.6的安装。至于为啥是这些,是因为要跑yolov5啊。。。
cuda和cudnn安装
新安装的Ubuntu系统,显卡一些驱动并没有正确的设置好,所以在安装之前需要调整一下
- 在终端输入
nvidia-smi
提示未安装驱动,并在下方给出几个驱动版本推荐安装,这里我们直接退出终端 - 打开‘系统设置’–>‘软件和更新’–>‘附加驱动’–>选择第一个驱动
忘记截图了,网上找了一张大概示意一下。
当然还有其他方式安装驱动,这里我偷个懒,点击‘应用更改 ’,然后等待下载安装,完成后重启。
3.重启后终端输入‘nvidia-smi
’应该有显卡信息了,还没有自行百度对应解决,这里不多赘述。这一步配置anaconda镜像源。
打开https://mirror.tuna.tsinghua.edu.cn/help/anaconda/ 这个网站复制下面代码
在终端输入gedit .condarc
回车,在弹出的文本页面中将页面清空并将上述代码粘贴其中,保存退出。
接着输入 conda clean -i
来清除索引缓存,保证用的是镜像站提供的索引。
4.安装cuda和cudnn 终端输入‘conda install python cudatoolkit=10.1 cudnn=7.6
’
5.安装torch和torchvision 终端输入‘conda install pytorch torchvision -c pytorch
’ 我现在安装的是最新版所以没有带上版本号,不是最新的自己要带上版本。
6.安装完成后终端验证,进入python环境,‘import torch
’ 'torch.cuda.is_available()
',输出是True即成功。可以在输入‘torch.rand(4,4).cuda()
’自己看下。
在安装一台电脑时候,遇到'torch.cuda.is_available()
’,输出是False的情况。
上图
打算移除nvidia_uvm重新加载模块的,结果发现并没有正确的加载。。。。
lsmod | grep nvidia
查询一看确实没有
重新sudo modprobe nvidia_uvm
加载,再次查看有了
最后验证一下:
发现cuda已正确调用,重启再运行此代码正常调用。至此配置结束。