有如下输出:
以下是对 NVIDIA-SMI 输出中各参数含义的解释:
• NVIDIA-SMI 版本和驱动信息
o NVIDIA-SMI 535.171.04:NVIDIA 系统管理接口的版本号。
o Driver Version: 535.171.04:显示当前安装的 NVIDIA 显卡驱动程序的版本。
o CUDA Version: 12.2:表示当前系统中 CUDA 的版本,CUDA 是 NVIDIA 推出的并行计算平台和编程模型,用于在 NVIDIA GPU 上进行高性能计算。
• GPU 详细信息
o GPU Name:显卡的型号,这里都是 NVIDIA GeForce RTX 4090。
o Persistence-M:持久性模式,“Off” 表示关闭,持久性模式可以让 GPU 在某些应用程序结束后仍保持初始化状态,减少重新初始化的时间。
o Bus-Id:显示 GPU 在系统总线上的位置,格式为 “域:总线:设备。功能”,用于唯一标识系统中的每个 GPU。
o Disp.A:表示 GPU 是否正在用于显示输出,“Off” 表示当前 GPU 没有用于显示。
o Volatile Uncorr. ECC:显示与 GPU 内存相关的错误检查和纠正(ECC)状态,“Off” 表示 ECC 功能关闭。
o Fan:风扇转速百分比,反映 GPU 风扇的运行速度。
o Temp:GPU 核心温度,单位是摄氏度。
o Perf:GPU 当前的性能状态,“P0” 表示最高性能状态,数值越大性能越低。
o Pwr:Usage/Cap:分别表示 GPU 的功耗和功率上限,单位是瓦特。
o Memory-Usage:显示当前 GPU 内存的使用情况,格式为 “已使用内存 / 总内存”,单位是 MiB(兆字节)。
o GPU-Util:GPU 的利用率,反映 GPU 在一段时间内的繁忙程度,百分比表示。
o Compute M.:计算模式,“Default” 表示默认计算模式。
o MIG M.:多实例 GPU(MIG)模式,这里显示为 “N/A”,表示当前未使用 MIG 模式。MIG 允许将单个物理 GPU 划分为多个逻辑 GPU 实例,以提高资源利用率和隔离性。
• Processes(进程信息):这部分通常会显示使用 GPU 的进程的相关信息,包括 GPU 编号、进程 ID、进程类型、进程名称以及该进程使用的 GPU 内存量