nvidia-docker容器中nvidia-smi中CUDA Version显示N/A

最新推荐文章于 2024-08-06 15:26:26 发布

桐原因

最新推荐文章于 2024-08-06 15:26:26 发布

阅读量9.1k

点赞数 5

分类专栏：深度学习文章标签： docker nvidia gpu cuda

本文链接：https://blog.csdn.net/qq_36287702/article/details/121384246

版权

深度学习专栏收录该内容

25 篇文章 6 订阅

订阅专栏

nvidia-docker2版本以上增加在启动容器的时候加上

 -e NVIDIA_VISIBLE_DEVICES=all

在容器中使用nvidia-smi可以显示出GPU信息

图源：来自网络

但是发现CUDA Version的版本为N/A，使用torch.cuda.is_available()会出现报错

UserWarning: CUDA initialization: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and installed a driver from http://www.nvidia.com/Download/index.aspx (Triggered internally at /pytorch/c10/cuda/CUDAFunctions.cpp:100.)
　　return torch._C._cuda_getDeviceCount() > 0

造成这样的主要原因是因为环境变量的配置

需要在启动容器时候加上

-e NVIDIA_DRIVER_CAPABILITIES=compute,utility

如果你不改这个环境变量，宿主机的nvidia driver在容器内是仅作为utility存在的，也就是个花瓶。如果加上compute，宿主机的英伟达driver将对容器提供计算支持(所谓的计算支持也就是cuda支持)。

这样大概率问题就解决了

当然更推荐是将docker版本升级19以后，就不用使用nvidia-docker操作，在docker起容器的时候直接加上

-e gpus=all

就可以使用宿主机的GPU了，更为方便。

参考：

Found no NVIDIA driver on your system · Issue #533 · NVIDIA/nvidia-docker · GitHub

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

桐原因

关注关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

『CV学习笔记』docker和nvidia-docker离线安装

AI新视界

08-08

1130

docker和nvidia-docker离线安装。

nvidia-docker2及k8s安装

Rocco_26的博客

12-07

593

一：安装驱动二：安装cuda10.2

2 条评论您还未登录，请先登录后发表或查看评论

nvidia-smi CUDA Version:N/A

JiuYux的博客

04-20

1104

nvidia-smi显示：CUDA Version:N/A显示：CUDA Version: Not Found。

version N/A - N/A is not yet installed 解决方案

十甫寸木南的博客

06-02

5836

`version "N/A -> N/A" is not yet installed` 错误主要是由于 `N/A` 对应的 Node 版本没有安装导致的，只要将相应的 Node 版本安装上，并成功指向就可以了。

在虚拟机上使用nvidia-smi命令查看cuda版本不是实际cuda版本

最新发布

Hui01080的博客

08-06

299

当你在虚拟机上使用nvidia-smi命令查看当前cuda版本时显示的是物理机的cuda版本而不是当前虚拟机中的cuda版本。可以看到使用nvidia-smi查看的cuda版本为12.4，而nvcc --version查看的cuda版本为11.6。此时可以使用以下命令查看cuda版本。

nvidia-smi显示CUDA Version: N/A

RubiaC的博客

07-04

3144

踩坑记录

nvidia-smi中cuda version：N/A 解决记录

weixin_50961326的博客

07-16

304

留个帖子，方便以后自己再出现问题回看，也方便其他有相同问题的伙伴尝试，也欢迎大佬解答疑惑。具体bug出现原因未知，解决方法来源于chatgpt，原理未知，是否完全解决未知。不知道为什么实验室服务器突然不能用gpu训练。输入nvidia-smi显示。

GPU显存占用但nvidia-smi不显示进程号, nvtop出现N/A

L_egend_ing的博客

03-27

1124

(LINUX)

docker内部执行nvidia-smi无任何显示的解决方法

davidhopper的博客

04-11

6120

仔细观察启动Docker的提示，说是Docker内部的Nvidia显卡驱动异常，未能启用Nvidia显卡，于是按照Nvidia官方网站。相关的代码居然没有编译，于是在Docker内部执行Nvidia显卡驱动检测命令。最开始我以为是Docker启动有问题，于是连续重启两次，仍然是。本以为万事大吉，结果非常不幸，执行第一步。今天在Docker内部编译程序，发现与。进入Docker，执行命令。

Ubuntu18.04下docker+NVIDIA-docker2指定版本安装

风轻时听花落的博客

04-21

935

1 . $ sudo apt update（安装docker时报错找不到docker, 使用sudo apt-get update) 2 .$ sudo apt install apt-transport-https ca-certificates curl software-properties-common 3 .在/etc/apt/sources.list.d/docker.list文件中添加如下文本 deb [arch=amd64] https://download.docker.com/l..

机器学习-搭建环境-3：Linux下nvidia-docker的安装（在容器中使用GPU）

阿门的博客

04-12

573

安装Nvida-docker：参考按照官网的指导：https://github.com/NVIDIA/nvidia-docker If you arenotusing the officialdocker-cepackage on CentOS/RHEL, use the next section.： # If you have nvidia-docker 1.0 install...

centos7上安装 nvidia-docker2

weixin_40592935的博客

02-07

3621

在 CentOS 7 上设置 Docker

nvidia-smi 命令解读

热门推荐

天岚1993_量产机的博客

03-15

6万+

nvidia-smi是用来查看GPU使用情况的。我常用这个命令判断哪几块GPU空闲，但是最近的GPU使用状态让我很困惑，于是把nvidia-smi命令显示的GPU使用表中各个内容的具体含义解释一下。

nvcc -V和nvidia-smi出现的cuda版本不同

Chauncey_Wang的博客

12-19

3万+

我发现实验室的服务器中 nvidia-smi的结果而nvcc -V的结果 CUDA有两个主要的API：runtime(运行时) API和driver API。这两个API都有对应的CUDA版本（如9.0和11.1等）。用于支持driver API的必要文件(如libcuda.so)是由GPU driver installer安装的。nvidia-smi就属于这一类API。用于支持runtime API的必要文件(如libcudart.so以及nvcc)是由CUDA Toolkit installe

超实用总结！！显卡驱动无法支持cuda版本问题（终于捋清楚显卡驱动、cuda、pytorch的对应关系了）

qq_42537243的博客

04-08

6373

用pytorch编写机器学习代码总会遇到cuda、显卡驱动版本不匹配的问题，经过一番折腾，终于捋清楚显卡驱动、cuda、pytorch的对应关系了！！！

nvidia-smi指令

DATA8866的博客

03-29

6326

Wed Mar 29 19:39:28 2017 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 367.48 Driver Version: 367.48 | |----

nvidia-smi命令详解

Pythonlittlegirl的博客

04-02

812

Compute M：计算模式，0/DEFAULT，1/EXCLUSIVE_PROCESS，2/PROHIBITED，上图均为Default。由于我的笔记本电脑是2020版联想拯救者y7000，因此是自带独立显卡的，经过师姐的提醒，我打算用笔记本自带的显卡跑实验。Persistence-M：持续模式状态，持续模式耗能大，但在新的GPU应用启动时花费时间更少，上图均为On。GPU：本机中的GPU编号，从0开始，上图为0，1，2，3四块GPU。Fan：风扇转速（0%-100%），N/A表示没有风扇。

nvidia-smi命令解析

weixin_43745234的博客

04-28

1495

persistence mode 能够让 GPU 更快响应任务，待机功耗增加。Persistence-M：持续模式状态（持续模式耗能大，但在新的GPU应用启动时花费时间更少）Volatile GPU-UTil：GPU使用率，与显存使用率的区别可参考显存与GPU。Temp：GPU温度（GPU温度过高会导致GPU频率下降）Perf：性能状态，从P0（最大性能）到P12（最小性能）Bus-Id：GPU总线，00000000:37:00.0。Fan:风扇转速（0%-100%），N/A表示没有风扇。

nvidia-smi 命令详解

泠山的博客

09-09

1531

是一种命令行实用程序，用于监控和管理 NVIDIA GPU（图形处理器）的状态和性能。它提供了一种简单而强大的方式来获取有关 GPU 的实时信息，并且可以用于诊断、优化和管理 GPU 资源。

ubuntu16.04安装nvidia-docker

09-19

### 回答1： 1. 首先，需要安装NVIDIA驱动程序。可以通过以下命令安装： sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt-get update sudo apt-get install nvidia-384 2. 安装Docker。可以通过以下命令安装： sudo apt-get install docker.io 3. 安装nvidia-docker。可以通过以下命令安装： curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update sudo apt-get install nvidia-docker2 sudo pkill -SIGHUP dockerd 4. 验证nvidia-docker是否安装成功。可以通过以下命令验证： sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi 如果nvidia-smi显示了GPU信息，则说明nvidia-docker已经成功安装。 ### 回答2：安装nvidia-docker是为了在Ubuntu 16.04上使用NVIDIA GPU进行深度学习和机器学习等任务。以下是在Ubuntu 16.04上安装nvidia-docker的步骤： 1. 在终端中，使用以下命令添加NVIDIA Docker软件包的存储库： ``` $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) $ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - $ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list $ sudo apt-get update ``` 2. 安装nvidia-docker软件包： ``` $ sudo apt-get install -y nvidia-docker2 $ sudo pkill -SIGHUP dockerd ``` 3. 使用以下命令验证安装是否成功： ``` $ docker run --gpus all nvidia/cuda:11.0-base nvidia-smi ``` 如果成功安装并配置正确，将显示GPU的信息。通过以上步骤，你可以在Ubuntu 16.04上成功安装nvidia-docker，并使用NVIDIA GPU进行深度学习和机器学习等任务。请注意，确保你的系统安装了合适的NVIDIA GPU驱动程序，并且能够与nvidia-docker兼容。