1.安装最新版的Docker
# 如果有旧版本的话得先卸载
apt-get remove docker docker-engine docker.io
# 使用官方脚本进行安装
curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun
2.启动docker服务
sudo systemctl start docker
3.测试docker是否安装成功
sudo docker -v
sudo systemctl status docker
# 若是都能正常显示的话则表示安装成功
4.安装nvidia运行时环境(若docker容器需要使用显卡的话则需要安装)
# 添加nvidia的存储库
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
# 安装nvidia运行时环境
sudo apt update
sudo apt install nvidia-container-runtime
5.配置docker以使用nvidia运行时
编辑或者创建(如果不存在)Docker的配置文件/etc/docker/daemon.json
,并添加以下内容:
{
"default-runtime": "nvidia",
"runtimes": {
"nvidia": {
"path": "/usr/bin/nvidia-container-runtime",
"runtimeArgs": []
}
}
}
6.验证nvidia运行时
sudo systemctl restart docker
sudo docker run --gpus all nvidia/cuda:11.0-base nvidia-smi
如果一切正常的话,应该能够看到nvidia的nvidia-smi
命令的输出,显示了GPU的信息
参考文章
为Docker安装NVIDIA运行时环境(NVIDIA Container Runtime for Docker)
Ubuntu安装docker