ubuntu 22.04 深度学习环境配置,基于docker(包含安装NVIDIA驱动)

第一步 安装驱动

网址:https://www.nvidia.com/download/index.aspx
根据硬件选择,我这里是 ubuntu 服务器,显卡是v100
在这里插入图片描述

sudo su root
chmod a+x NVIDIA  //按 TAB 即可   加运行权限
# 禁用原显卡驱动
vim /etc/modprobe.d/blacklist.conf
# 在最后一行加
blacklist nouveau
# 执行下面命令,让其生效
update-initramfs -u
# 重启
reboot

(非必要)补充:在禁用原显卡驱动时,可以增加一步。
这两个命令都是用于配置Linux系统中与Nouveau显卡驱动相关的设置,但它们的具体作用和写入内容是不同的。
第一个命令是禁止Nouveau显卡驱动。
第二个命令是修改Nouveau显卡驱动的行为,使其在启动时不使用KMS功能

sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"

这个命令的目的是禁止(blacklist)Nouveau显卡驱动。具体来说,它会创建或覆盖/etc/modprobe.d/blacklist-nvidia-nouveau.conf文件,并在其中写入blacklist nouveau这一行。这样,Linux系统在启动时将不会加载Nouveau驱动,这对于需要安装和使用NVIDIA官方闭源驱动的用户来说是有用的,因为Nouveau驱动与NVIDIA官方驱动可能会冲突。

sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"

这个命令与上一个命令不同,它并不是完全禁止Nouveau驱动,而是修改其行为。这个命令会将options nouveau modeset=0这一行追加到/etc/modprobe.d/blacklist-nvidia-nouveau.conf文件的末尾。modeset=0这个选项意味着在启动时不使用Kernel Modesetting(KMS)功能,KMS是一个用于图形硬件初始化的内核功能。禁用KMS可以解决某些与Nouveau驱动相关的问题,例如启动时的图形故障。
补充完毕。

重启后:
输入用户名,密码
sudo su
密码

# 测试显卡禁用是否成功
# Lsmod 是小写的l      后面的是竖线 |  不是L也不是i
Ismod I grep nouveau

service lightdm stop      # 如果不成功  继续下面2行命令的操作
apt-get install lightdm    
service lightdm stop

# 安装两个必备包
apt-get install gcc
apt-get install make

# 安装驱动
./NV # 按TAB键补全

# 驱动安装验证
nvidia-smi

重启 reboot
驱动安装成功

第二步 安装docker

官方网址:https://docs.docker.com/engine/install/ubuntu/#set-up-the-repository

# 更新软件包索引并安装软件包以允许使用 基于 HTTPS 的存储库
sudo apt-get update
sudo apt-get install ca-certificates curl gnupg

# 添加 Docker 的官方 GPG 密钥:
sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
sudo chmod a+r /etc/apt/keyrings/docker.gpg

# 使用以下命令设置存储库:
echo \
  "deb [arch="$(dpkg --print-architecture)" signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu \
  "$(. /etc/os-release && echo "$VERSION_CODENAME")" stable" | \
  sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

sudo apt-get update

# 要安装最新版本,请运行:
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

# 验证
sudo docker run hello-world

第三步 安装nvidia-docker

ubuntu:

官方网址:https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

# 设置 Docker Ubuntu 上的 Docker-CE 可以使用 Docker 的官方便利脚本进行设置:
curl https://get.docker.com | sh \
  && sudo systemctl --now enable docker
# 设置软件包存储库和 GPG 密钥:
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
      && curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \
            sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
            sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 更新
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit
# 配置 Docker 守护程序以识别 NVIDIA 容器运行时
sudo nvidia-ctk runtime configure --runtime=docker
# 在设置默认运行时后重新启动 Docker 守护程序以完成安装
sudo systemctl restart docker
# 此时,可以通过运行基本 CUDA 容器来测试
sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:11.6.2-base-ubuntu20.04 nvidia-smi

官方上的截图
在这里插入图片描述

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

默执_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值