文章目录
0 设备及系统
- 联想Y9000P
- Ubuntu 20.04 双系统
注意:
因为需要使用 nvidia 显卡,所以虚拟机上不能安装softgym,需要双系统或纯Linux系统
1 安装Docker-ce
参见:ubuntu18.04安装docker-CE
虽然标题写的是ubuntu18.04
,但应该对各个ubuntu版本都适用,里面还总结了docker的常用命令,好评。
如果测试hello-world
出现问题,可以参考这篇博客:
docker 安装完成后测试hello-world出现问题(Unable to find image ‘hello-world:latest’ locally)
2 安装Nvidia-docker
从博客 nvidia-docker的安装 的安装NVIDIA Container Toolkit
这一节开始看起,但注意:
在安装cuda镜像的时候,博主给出的命令是:
sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
对这一步,笔者进行三个补充:
2.1 检查显卡驱动安装
个人建议,在执行这一命令之前,执行:
nvidia-smi
如果驱动安装没有问题的话,会出现如下界面:
如果驱动安装有问题,需要先解决驱动的问题。(显卡驱动如果不合适,系统的很多功能会受影响,比如屏幕亮度调节)我就是在这一步,发现虚拟机没有办法安装softgym,因为虚拟机使用的是虚拟显卡。
2.2 末尾的 nvidia-smi 用处
用来测试安装是否成功用的,如果前面的命令正常执行完,就会执行nvidia-smi 输出显卡驱动信息。
2.3 nvidia/cuda:11.0-base 是该博主的系统所适配的cuda类型,不一定可以照搬,更不可以想当然地修改
如果执行该命令出现了报错:
Error response from daemon: manifest for nvidia/cuda:11.0 not found: manifest unknown: manifest unknown
参考这个博客:Error response from daemon: manifest for nvidia/cuda:latest not found: manifest unknown: manifest
知,原因为:命令中cuda后面填写的版本型号不存在,可以从文档中查找对应自己系统的版本型号,进行修改和替换。链接如下: ubuntu与cuda版本对应关系
如果出现报错:
docker: Error response from daemon: could not select device driver ““ with capabilities: [[gpu]]
可以重启docker,命令:sudo systemctl restart docker
(参考:docker: Error response from daemon: could not select device driver ““ with capabilities: [[gpu]]问题解决)
最后拉ubuntu镜像那一步就不需要了,之前已经测试过hello-world了。