Ubantu20.04查看显卡信息

本文介绍了如何在 Ubuntu 20.04 上使用 NVIDIA-SMI 工具来查看 GPU 的基本信息,如温度、风扇转速、功耗,以及如何动态监控 GPU 的利用率和性能状态。此外,还详细解析了 nvidia-smi 命令的各种选项,包括设置 GPU 状态、动态刷新信息和导出查询结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1  NVIDIA-SMI介绍

        nvidia-smi简称NVSMI,提供监控GPU使用情况和更改GPU状态的功能,是一个跨平台工具,它支持所有标准的NVIDIA驱动程序支持的Linux发行版以及从WindowsServer 2008 R2开始的64位的系统。该工具是N卡驱动附带的,只要安装好驱动后就会有它。

        Windows下程序位置:C:\Program Files\NVIDIACorporation\NVSMI\nvidia-smi.exe。Linux下程序位置:/usr/bin/nvidia-smi,由于所在位置已经加入PATH路径,可直接输入nvidia-smi运行。

2  NVIDIA-SMI命令系列详解

2.1  nvidia-smi

显示所有GPU的当前信息状态

显示的表格中:

Fan:                     风扇转速(0%--100%),N/A表示没有风扇

Temp:                 GPU温度(GPU温度过高会导致GPU频率下降)

Perf:                    性能状态,从P0(最大性能)到P12(最小性能)

Pwr:                     GPU功耗

Persistence-M:   持续模式的状态(持续模式耗能大,但在新的GPU应用启动时花费时间更少)

Bus-Id:               GPU总线,domain:bus:device.function

Disp.A:                Display Active,表示GPU的显示是否初始化

Type:                "C"表示计算的进程,"G"表示图像处理的进程,"C+G"表示都有

Memory-Usage:显存使用率

Volatile GPU-Util:GPU使用率

ECC:                   是否开启错误检查和纠正技术,0/DISABLED, 1/ENABLED

Compute M.:     计算模式,0/DEFAULT,1/EXCLUSIVE_PROCESS,2/PROHIBITED

附加选项:

nvidia-smi –i xxx

指定某个GPU

nvidia-smi –l xxx

动态刷新信息(默认5s刷新一次),按Ctrl+C停止,可指定刷新频率,以秒为单位

nvidia-smi –f xxx

将查询的信息输出到具体的文件中,不在终端显示

2.2  nvidia-smi -q

查询所有GPU的当前详细信息

附加选项:

nvidia-smi –q –u

显示单元而不是GPU的属性

nvidia-smi –q –i xxx

指定具体的GPU或unit信息

nvidia-smi –q –f xxx

将查询的信息输出到具体的文件中,不在终端显示

nvidia-smi –q –x

将查询的信息以xml的形式输出

nvidia-smi -q –d xxx

指定显示GPU卡某些信息,xxx参数可以为MEMORY, UTILIZATION, ECC, TEMPERATURE, POWER,CLOCK, COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, PAGE_RETIREMENT,ACCOUNTING

nvidia-smi –q –l xxx

动态刷新信息,按Ctrl+C停止,可指定刷新频率,以秒为单位

2.3  设备修改选项

可以手动设置GPU卡设备的状态选项

nvidia-smi –pm 0/1

设置持久模式:0/DISABLED,1/ENABLED

nvidia-smi –e 0/1

切换ECC支持:0/DISABLED, 1/ENABLED

nvidia-smi –p 0/1

重置ECC错误计数:0/VOLATILE, 1/AGGREGATE

nvidia-smi –c

设置计算应用模式:0/DEFAULT,1/EXCLUSIVE_PROCESS,2/PROHIBITED

nvidia-smi –r

GPU复位

nvidia-smi –vm

设置GPU虚拟化模式

nvidia-smi –ac xxx,xxx

设置GPU运行的工作频率。e.g. nvidia-smi –ac2000,800

nvidia-smi –rac

将时钟频率重置为默认值

nvidia-smi –acp 0/1

切换-ac和-rac的权限要求,0/UNRESTRICTED, 1/RESTRICTED

nvidia-smi –pl

指定最大电源管理限制(瓦特)

nvidia-smi –am 0/1

启用或禁用计数模式,0/DISABLED,1/ENABLED

nvidia-smi –caa

清除缓冲区中的所有已记录PID,0/DISABLED,1/ENABLED

2.4  nvidia-smi dmon

设备监控命令,以滚动条形式显示GPU设备统计信息。

GPU统计信息以一行的滚动格式显示,要监控的指标可以基于终端窗口的宽度进行调整。 监控最多4个GPU,如果没有指定任何GPU,则默认监控GPU0-GPU3(GPU索引从0开始)。

 

附加选项:

nvidia-smi dmon –i xxx

用逗号分隔GPU索引,PCI总线ID或UUID

nvidia-smi dmon –d xxx

指定刷新时间(默认为1秒)

nvidia-smi dmon –c xxx

显示指定数目的统计信息并退出统计信息并退出,显示4条并退出

 

nvidia-smi dmon –s xxx

指定显示哪些监控指标(默认为puc),其中:

p:电源使用情况和温度(pwr:功耗,temp:温度)

u:GPU使用率(sm:流处理器,mem:显存,enc:编码资源,dec:解码资源)

c:GPU处理器和GPU内存时钟频率(mclk:显存频率,pclk:处理器频率)

v:电源和热力异常

m:FB内存和Bar1内存

e:ECC错误和PCIe重显错误个数

t:PCIe读写带宽

nvidia-smi dmon –o D/T

指定显示的时间格式D:YYYYMMDD,THH:MM:SS

nvidia-smi dmon –f xxx

将查询的信息输出到具体的文件中,不在终端显示
 

2.5   nvidia-smi pmon

进程监控命令,以滚动条形式显示GPU进程状态信息。

GPU进程统计信息以一行的滚动格式显示,此工具列出了GPU所有进程的统计信息。要监控的指标可以基于终端窗口的宽度进行调整。 监控最多4个GPU,如果没有指定任何GPU,则默认监控GPU0-GPU3(GPU索引从0开始)。

附加选项:

nvidia-smi pmon –i xxx

用逗号分隔GPU索引,PCI总线ID或UUID

nvidia-smi pmon –d xxx

指定刷新时间(默认为1秒,最大为10秒)

nvidia-smi pmon –c xxx

显示指定数目的统计信息并退出

nvidia-smi pmon –s xxx

指定显示哪些监控指标(默认为u),其中:

u:GPU使用率

m:FB内存使用情况

nvidia-smi pmon –o D/T

指定显示的时间格式D:YYYYMMDD,THH:MM:SS

nvidia-smi pmon –f xxx

将查询的信息输出到具体的文件中,不在终端显示


————————————————
版权声明:本文为CSDN博主「Michael丶Bear」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/handsome_bear/article/details/80903477

 

Ubuntu 20.04上安装CUDA和CUDNN的详细步骤如下: 1. 首先,确保你的系统已经安装了合适的NVIDIA显卡驱动。你可以通过运行以下命令来检查驱动程序的安装情况: ``` nvidia-smi ``` 如果该命令成功运行并显示了NVIDIA显卡信息,则说明驱动程序已正确安装。 2. 接下来,下载适用于Ubuntu 20.04的CUDA安装包。你可以从NVIDIA的官方网站上下载最新的CUDA安装包。 3. 下载完成后,打开终端并导航到下载目录。运行以下命令给安装包赋予执行权限: ``` chmod +x cuda_11.6.1_510.47.03_linux.run ``` 4. 运行安装程序并按照提示进行安装: ``` sudo ./cuda_11.6.1_510.47.03_linux.run ``` 5. 安装过程中会出现一些设置选项,你可以根据需要进行选择。通常情况下,你可以接受默认选项。 6. 安装完成后,导入CUDA环境变量。打开终端并编辑你的bashrc文件: ``` nano ~/.bashrc ``` 7. 在文件末尾添加以下两行代码: ``` export PATH=/usr/local/cuda-11.6/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} ``` 8. 保存文件并退出编辑器。运行以下命令使变量生效: ``` source ~/.bashrc ``` 9. 最后,验证CUDA安装是否成功。运行以下命令以检查CUDA版本: ``` nvcc --version ``` 10. 如果命令成功运行并显示了CUDA的版本信息,则说明安装成功。 安装CUDNN的详细步骤如下: 1. 首先,从NVIDIA的官方网站上下载适用于你的CUDA版本的CUDNN安装包。 2. 下载完成后,打开终端并导航到下载目录。运行以下命令解压安装包: ``` tar -xzvf cudnn-11.6-linux-x64-v8.2.0.53.tgz ``` 3. 进入解压后的目录: ``` cd cuda ``` 4. 将CUDNN的库文件复制到CUDA的安装目录: ``` sudo cp -P include/cudnn*.h /usr/local/cuda-11.6/include sudo cp -P lib64/libcudnn* /usr/local/cuda-11.6/lib64 ``` 5. 为CUDNN的库文件设置适当的权限: ``` sudo chmod a+r /usr/local/cuda-11.6/include/cudnn*.h /usr/local/cuda-11.6/lib64/libcudnn* ``` 现在,你已经成功安装了CUDA和CUDNN。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值