参考链接
Deep Learning:PyTorch 基于docker 容器的分布式训练实践
基于Docker的大规模人脸数据集分布式训练
Ubuntu安装docker
ubuntu下自带了docker的库,不需要添加新的源。
但是ubuntu自带的docker版本太低,需要先卸载旧的再安装新的。
1、卸载旧版本
apt-get remove docker docker-engine docker.io containerd runc
使用apt-get命令时,如果出现Could not get lock /var/lib/dpkg/lock-frontend,说明之前使用apt时出现异常,没有正常关闭,还在运行。
解决:使用ps 和 grep查找apt的pid,并使用kill杀死掉
参考Could not get lock /var/