查看GPU的nvidia-smi命令

【注】转载 我转载的那个人好像也是转载的,但是似乎并没有标注原文的出处,我就把我转的那篇博客的地址贴出来吧

https://blog.csdn.net/csdnofzyk/article/details/80187919

了解GPU从nvidia-smi命令开始

2018年05月03日 21:55:36

阅读数:151

前言

相信各位在安装完NVIDIA GRID软件以后,官方建议的第一种验证GRID是否成功安装的方法就是在命令行下执行nvidia-smi,查看GPU信息是否可以正常的输出来判断GRID是否正常安装。今天我们就重点了解下NVIDIAGPU最重要的命令之一nvidia-smi。

原文:https://developer.nvidia.com/nvidia-system-management-interface

首先我们来看官方对nvidia-smi的定义:

1 基于NVIDIA Management Library (NVIDIA管理库),实现NVIDIA GPU设备的管理和监控功能

2 主要支持Tesla, GRID, Quadro以及TitanX的产品,有限支持其他的GPU产品

所以我们在常见的NVIDIAGPU产品上安装完驱动后,都同时安装上nvidia-smi管理工具,帮助管理人员通过命令行的方式对GPU进行监控和管理。

当我们成功部署了GRID软件以后,我们可以通过以下nvidia-smi命令实现对GPU的管理。

nvidia-smi会随着GRID软件不断的升级,而功能不断的丰富,所以当我们在执行一些复杂的nvidia-smi命令时,可能早期的GRID版本无法支持这些命令。本文的命令基于GRID 5版本,所以在使用的时候请有所注意:

以下nvidia-smi常用命令行是个人推荐了解的:

1. nvidia-smi

nvidia-smi会显示出当前GPU的所有基础信息。

2. nvidia-smi vgpu

查看当前vGPU的状态信息:

3. nvidia-smi vgpu -p 循环显示虚拟桌面中应用程序对GPU资源的占用情况

4. nvidia-smi -q 查看当前所有GPU的信息,也可以通过参数i指定具体的GPU。

比如nvidia-smi-q -i 0 代表我们查看服务器上第一块GPU的信息。

通过nvidia-smi -q 我们可以获取以下有用的信息:

GPU的SN号、VBIOS、PN号等信息:

GPU的总线、PCI-E总线倍速、风扇转速等信息:

GPU的显存、BAR1、所有资源利用率、ECC模式等信息:

GPU的温度和功率等信息:

通过以上的命令我们基本上可以对当前vGPU环境的物理GPU和正在运行的vGPU有一个基本的了解,为我们后续的性能调优和故障排错提供保证。

欢迎关注 欢迎转载

`nvidia-smi`是NVIDIA System Management Interface(管理系统界面)的一个实用工具,主要用于监控和管理NVIDIA图形处理器(GPU)。它提供了一系列强大的命令选项,以帮助用户了解GPU状态、性能数据、驱动信息以及电源管理等。以下是`nvidia-smi`命令的一些常用选项及其功能: 1. **查询GPU基本信息**: - `nvidia-smi`: 显示简化的GPU信息,如GPU型号、温度、功率等。 - `nvidia-smi -L`: 列出所有安装的GPU设备。 2. **实时监控**: - `nvidia-smi -d Pid`: 监控特定进程PID对应的GPU使用情况。 - `nvidia-smi -s T`: 设置刷新时间间隔,例如 `nvidia-smi -s 1`表示每秒刷新一次。 3. **性能分析**: - `nvidia-smi -q`: 安静模式,只返回查询结果。 - `nvidia-smi -h` 或 `nvidia-smi --help`: 查看完整命令帮助文档。 4. **管理和控制**: - `nvidia-smi -k [pid]`: 杀死GPU应用进程(pid),如果省略则杀死所有GPU相关的进程。 - `nvidia-smi -pm 0/1/2`: 控制GPU的电源管理模式(0=自动,1=高性能,2=节能)。 5. **内存管理**: - `nvidia-smi -m reset` 或 `-m freedriver`: 尝试释放GPU内存。 - `nvidia-smi -mc [mode]`: 管理CUDA池,如设置共享内存模式。 6. **显示应用程序详细信息**: - `nvidia-smi -a`: 显示所有运行在GPU上的应用程序及它们的资源使用情况。 使用`nvidia-smi`之前,确保已经安装了NVIDIA的驱动程序,并且正确配置了环境变量。对于详细的命令列表和每个选项的具体用途,可以在终端运行`nvidia-smi --help`获取完整的帮助文档。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值