NVIDIA-Docker中的cuda安装

在 Nvidia-Docker 中安装 cudnn

安装完Nvidia-Docker 之后,可以通过以下步骤安装docker中的 cudnn。

  • 1.首先要通过如下命令查看自己应该安装的cuda版本。
nvcc -V

我的cuda版本是:12.4,控制台显示如下:

  • nvcc: NVIDIA ® Cuda compiler driver
    Copyright © 2005-2024 NVIDIA Corporation
    Built on Thu_Mar_28_02:18:24_PDT_2024
    Cuda compilation tools, release 12.4, V12.4.131
    Build cuda_12.4.r12.4/compiler.34097967_0
所以我选择的是: 12.4.0-cudnn-devel-ubuntu20.04

对于cudnn的版本,一共有三个:1、base 2、runtime 3、devel

  • base: 基于CUDA,包含最精简的依赖,用于部署预编译的CUDA应用,需要手工安装所需要的其他依赖
  • runtime: 基于base,添加了cuda toolkit共享的库
  • devel: 基于runtime,添加了便于工具链,调试工具,头文件,静态库。用于从源码编译CUDA应用
最好,最简单,最省事的选择的是安装devel版本,因为devel版本包含了cuda toolkit,cudnn,以及头文件,静态库等,方便我们进行开发。

安装

  • 到 https://hub.docker.com 中搜索nvidia/cuda, 然后在tags中选择和自己电脑中cudnn版本(ncvv-V)一致的版本
  • 也要注意自己的ubuntu系统版本哈,我的是20.04
  • 然后拷贝拉取和安装镜像的命令,我的是:
docker pull nvidia/cuda:12.4.1-runtime-ubuntu20.04
  • 拉取&安装完成后,使用docker images查看镜像,可以看到已经安装好了
(base) xx@xxxxx:~/Downloads$ docker images
REPOSITORY                      TAG                              IMAGE ID       CREATED         SIZE
nvidia/cuda                     12.4.1-cudnn-devel-ubuntu20.04   ef5d9d001373   2 days ago      8.28GB

这样就安装好了cuda和cudnn,接下来就可以在docker中使用cuda了。

查看显卡信息

docker run --runtime=nvidia --rm <自己的nvidia/cuda对应的IMAGE ID> nvidia-smi

比如我的IMAGE ID是ef5d9d001373,所以查看显卡的命令如下(和nvidia-smi命令的功能是一样的):

docker run --runtime=nvidia --rm ef5d9d001373 nvidia-smi

显示结果如下,则表示安装成功了:

==========
== CUDA ==
==========

CUDA Version 12.4.1

Container image Copyright (c) 2016-2023, NVIDIA CORPORATION & AFFILIATES. All rights reserved.

This container image and its contents are governed by the NVIDIA Deep Learning Container License.
By pulling and using the container, you accept the terms and conditions of this license:
https://developer.nvidia.com/ngc/nvidia-deep-learning-container-license

A copy of this license is made available in this container at /NGC-DL-CONTAINER-LICENSE for your convenience.

Thu Apr 25 05:37:47 2024       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.15              Driver Version: 550.54.15      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 4090        Off |   00000000:01:00.0  On |                  Off |
|  0%   48C    P8             24W /  450W |     908MiB /  24564MiB |      3%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                                                         
+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
+-----------------------------------------------------------------------------------------+

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: CentOS 是一种广泛使用的Linux操作系统,而NVIDIA-Docker是一个用于在容器运行GPU加速应用程序的工具。对于在没有互联网连接的环境安装NVIDIA-Docker,可以通过以下步骤进行离线安装。 1. 从NVIDIA官方网站下载所需的NVIDIA-Docker离线安装包(tar文件),包括NVIDIA-Docker的二进制文件和依赖项。确保选择适用于CentOS的正确版本。 2. 将下载的安装包传输到CentOS服务器上,可以使用U盘、移动硬盘等离线传输设备。 3. 在CentOS服务器上创建一个新的目录,用于解压下载的安装包。例如,可以使用以下命令创建一个名为nvidia-docker的目录: ``` mkdir nvidia-docker ``` 4. 将下载的安装包移动到nvidia-docker目录。 5. 进入nvidia-docker目录并解压安装包。可以使用以下命令解压: ``` tar -xvf <安装包文件名>.tar.gz ``` 6. 解压后,进入解压得到的目录,例如: ``` cd nvidia-docker-<版本号> ``` 7. 执行安装脚本以进行NVIDIA-Docker的离线安装。可以使用以下命令运行安装脚本: ``` ./install.sh ``` 8. 安装脚本会检查并安装NVIDIA-Docker所需要的依赖项,并将NVIDIA-Docker设置为默认的容器运行时。 9. 完成安装后,可以通过运行以下命令验证NVIDIA-Docker是否正确安装: ``` nvidia-docker run --rm nvidia/cuda nvidia-smi ``` 如果成功运行,并显示了GPU的信息,那么NVIDIA-Docker已成功安装并可以在离线环境使用了。 请注意,离线安装可能需要手动处理依赖项,例如安装适当的驱动程序和库文件。因此,在进行离线安装之前,请确保已阅读官方文档并了解所需的所有依赖项。 ### 回答2: 在离线环境下安装NVIDIA-Docker,我们需要进行以下步骤: 1. 准备离线环境所需的安装包和资源: - NVIDIA-Docker安装包(.run文件) - NVIDIA的驱动程序(.run文件) - Docker安装包(.tar文件) - Docker镜像所需的显卡驱动(可从其他在线环境提取) 2. 在离线机器上安装依赖项: - 首先,确保离线机器的操作系统为CentOS,并且已经安装了gcc、kernel-devel和kernel-headers等依赖包。 - 然后,通过运行NVIDIA驱动程序的.run文件来安装NVIDIA驱动。 3. 安装Docker: - 将Docker的.tar文件复制到离线机器上的目录。 - 使用`tar -xvf`命令解压文件。 - 将解压后的文件夹复制到/usr/bin目录下,确保Docker可执行文件可用。 4. 安装NVIDIA-Docker: - 将离线机器连接到互联网,下载并复制NVIDIA-Docker安装包(.run文件)到离线机器上。 - 运行`chmod +x`命令赋予文件可执行权限。 - 运行`.run`文件来安装NVIDIA-Docker。 5. 配置NVIDIA-Docker: - 在/etc/docker/daemon.json文件添加`"runtimes": {"nvidia": {"path": "/usr/bin/nvidia-container-runtime","runtimeArgs": []}}`,以告知Docker使用NVIDIA运行时。 - 通过运行`systemctl restart docker`重新启动Docker服务。 6. 验证安装: - 运行`docker run --gpus all nvidia/cuda:11.0-base nvidia-smi`命令,如果成功显示GPU信息,则表示安装成功。 需要注意的是,由于离线环境无法直接从互联网下载所需的安装包和资源,因此需要从其他在线环境提取,并在离线机器上复制和安装。另外,要根据具体的硬件和软件版本来选择正确的驱动程序和安装包。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值