Ubuntu16.04 安装nvidia-docker及解决问题

前言

本文整理总结主要借鉴下面的文章:
1. ubuntu16.04下docker和nvidia-docker安装
2. 在Ubuntu上安装Docker
3. 解决 docker WARNING: Error loading config file: /home/xxj/.docker/config.json: stat /home/xxj/.docker
4. Docker启动Get Permission Denied
5. nvidia-dokcer常见问题总汇(博主踩过的各种各样的坑)
特别感谢博主们!

一. 安装步骤

1. 清除系统原有docker, 如果提示找不到就不用理会
sudo apt-get remove docker docker-engine docker.io 
2. 更新apt-get源
sudo apt-get update 
3. 配置apt允许以 HTTPS方式拉取镜像安装,即安装docker的依赖
sudo apt-get install apt-transport-https ca-certificates curl software-properties-common
456的作用是把docker仓库添加到apt库内
4. 添加Docker官方 GPG key
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - 
5. 校验 9DC8 5822 9FC7 DD38 854A E2D8 8D81 803C 0EBF CD88.
sudo apt-key fingerprint 0EBFCD88
6. 利用如下命令配置稳定镜像
sudo add-apt-repository “deb [arch=amd64] https://download.docker.com/linux/ubuntu \ 
$(lsb_release -cs) \ 
stable”
7. 再次更新
sudo apt-get update
8. 安装最新版Docker
sudo apt-get install docker-ce 
9. 验证docker是否安装成功。此命令会下载一个测试镜像,并且启动一个container来运行该镜像,打印下图信息后退出。
sudo docker run hello-world

在这里插入图片描述

10. 安装nvidia-docker:Install nvidia-docker and nvidia-docker-plugin
wget -P /tmp https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.1/nvidia-docker_1.0.1-1_amd64.deb
sudo dpkg -i /tmp/nvidia-docker*.deb && rm /tmp/nvidia-docker*.deb
11. Test nvidia-smi 验证是否安装成功执行以下命令看到如下回复就是成功了
sudo nvidia-docker run –rm nvidia/cuda:9.0-devel nvidia-smi   # 留意需输入cuda的版本+devel

在这里插入图片描述

二. 报错及解决办法

1. 解决 docker WARNING: Error loading config file: /home/xxj/.docker/config.json: stat /home/xxj/.docker

在终端执行docker images命令,会看到如下提示,
在这里插入图片描述
原因:
当前用户没有加入docker用户组

解决办法:
1). 创建 组

sudo groupadd docker

2). 将用户添加到该 组,例如我的xxj用户

sudo gpasswd -a ${USER} docker

在这里插入图片描述
3). 重启docker-daemon

sudo systemctl restart docker

在这里插入图片描述
4). 设置目录及其所有文件的权限

sudo chown "$USER":"$USER" /home/"$USER"/.docker -R
sudo chmod g+rwx "/home/$USER/.docker" -R

在这里插入图片描述
5). 验证,则无警告显示
在这里插入图片描述

2. 解决 Docker启动Get Permission Denied

问题描述:
安装完docker后,执行docker相关命令,出现

”Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get http://%2Fvar%2Frun%2Fdocker.sock/v1.26/images/json: dial unix /var/run/docker.sock: connect: permission denied“

原因:
摘自docker mannual上的一段话:
Manage Docker as a non-root user
The docker daemon binds to a Unix socket instead of a TCP port. By default that Unix socket is owned by the user root and other users can only access it using sudo. The docker daemon always runs as the root user.
If you don’t want to use sudo when you use the docker command, create a Unix group called docker and add users to it. When the docker daemon starts, it makes the ownership of the Unix socket read/writable by the docker group.
大概的意思就是:docker进程使用Unix Socket而不是TCP端口。而默认情况下,Unix socket属于root用户,需要root权限才能访问。

解决方法1:
使用sudo获取管理员权限,运行docker命令。

解决方法2:
docker守护进程启动的时候,会默认赋予名字为docker的用户组读写Unix socket的权限,因此只要创建docker用户组,并将当前用户加入到docker用户组中,那么当前用户就有权限访问Unix socket了,进而也就可以执行docker相关命令。

sudo groupadd docker     # 添加docker用户组
sudo gpasswd -a $USER docker     # 将登陆用户加入到docker用户组中
newgrp docker     # 更新用户组
docker ps    # 测试docker命令是否可以使用sudo正常使用
3. 解决 container_linux.go:247: starting container process caused “exec: “nvidia-smi”: executable file not found in $PATH”

解决办法:
run一个docker容器的时候指定你安装的cuda版本:如我的是cuda:9.0-devel.

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 1. 首先,需要安装NVIDIA驱动程序。可以通过以下命令安装: sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt-get update sudo apt-get install nvidia-384 2. 安装Docker。可以通过以下命令安装: sudo apt-get install docker.io 3. 安装nvidia-docker。可以通过以下命令安装: curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update sudo apt-get install nvidia-docker2 sudo pkill -SIGHUP dockerd 4. 验证nvidia-docker是否安装成功。可以通过以下命令验证: sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi 如果nvidia-smi显示了GPU信息,则说明nvidia-docker已经成功安装。 ### 回答2: 安装nvidia-docker是为了在Ubuntu 16.04上使用NVIDIA GPU进行深度学习和机器学习等任务。以下是在Ubuntu 16.04安装nvidia-docker的步骤: 1. 在终端中,使用以下命令添加NVIDIA Docker软件包的存储库: ``` $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) $ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - $ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list $ sudo apt-get update ``` 2. 安装nvidia-docker软件包: ``` $ sudo apt-get install -y nvidia-docker2 $ sudo pkill -SIGHUP dockerd ``` 3. 使用以下命令验证安装是否成功: ``` $ docker run --gpus all nvidia/cuda:11.0-base nvidia-smi ``` 如果成功安装并配置正确,将显示GPU的信息。 通过以上步骤,你可以在Ubuntu 16.04上成功安装nvidia-docker,并使用NVIDIA GPU进行深度学习和机器学习等任务。请注意,确保你的系统安装了合适的NVIDIA GPU驱动程序,并且能够与nvidia-docker兼容。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值