使用Docker在GPU服务器上运行时报错
docker run -d --gpus device=all -p 8502:8501 nvidia/cuda:11.2.2-runtime-centos7
docker: Error response from daemon: could not select device driver “” with capabilities: [[gpu]].
这是由于服务器缺少 docker 使用 GPU 的 nvidia 的工具包支持,要使 docker 容器能调用本地的 gpu
解决方式
由于服务器是centos7,所以我们只需要下载合适的yum源,安装`nvidia-container-runtime``即可
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo
sudo yum install nvidia-container-runtime
systemctl restart docker