1.安装显卡驱动
#卸载原先驱动
sudo apt-get remove --purge nvidia*
#查看当前显卡合适的驱动
ubuntu-drivers devices
#安裝驱动,注意改成你自己合适的驱动
sudo apt-get install nvidia-driver-450-server
# 重启
reboot
#查看显卡工作情况
nvidia-smi
2.docekr安裝
#docker安装
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository \
"deb [arch=amd64] https://mirrors.tuna.tsinghua.edu.cn/docker-ce/linux/ubuntu \
$(lsb_release -cs) \
stable"
sudo apt-get update
sudo apt-get install docker-ce
#检查版本
docker -v
#为避免docker操作必须要sudo,将当前用户加入docker用户组(${YOUR_NAME_HERE}处填当前用户名)
sudo usermod -aG docker ${YOUR_NAME_HERE}
##设置docker 源
#新建配置文件
vi /etc/docker/daemon.json
#在文件中写入清华源
{
“registry-mirrors”: [“https://docker.mirrors.ustc.edu.cn/”]
}
#重启服务
service docker restart
3安装nvidia-docker支持
nvidia官方教程: https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#installing-on-ubuntu-and-debian.
其中有些步骤有错误
建议使用以下方案
# Add the package repositories
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker
#测试
#### Test nvidia-smi with the latest official CUDA image
docker run --gpus all nvidia/cuda:10.0-base nvidia-smi