要么在docker环境内安装nvidia-driver
但容易和外面的版本不一致导致各种报错version mismatch之类的
不如使用nvidia-docker,这是一个nVidia官方为了方便在docker镜像容器内使用gpu做的包:
1. 保证docker环境内没有nvidia驱动程序,防止后续配置出现驱动版本不一致的情况
找到你要使用gpu的镜像,进入镜像删除相关驱动包:
sudo apt-get --purge remove "*nvidia*"
2. docker镜像外下载ubuntu-container-toolkit并安装并重启docker(要不然docker找不到刚装的toolkit)
sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker
3. 装好后在你的启动容器脚本中使用docker run --gpus all 即可在docker镜像里使用nvidia-smi
docker run --gpus all 你要用gpu的镜像名 nvidia-smi