Ubuntu下安装NVIDIA-SMI

环境

显卡:gt1030
系统:Ubuntu22.04

安装

1、查询显卡GeForce GT 1030

root@apq-K07-C236:/home# lspci
00:00.0 Host bridge: Intel Corporation 8th/9th Gen Core 8-core Desktop Processor Host Bridge/DRAM Registers [Coffee Lake S] (rev 0d)
00:01.0 PCI bridge: Intel Corporation 6th-10th Gen Core Processor PCIe Controller (x16) (rev 0d)
00:14.0 USB controller: Intel Corporation 100 Series/C230 Series Chipset Family USB 3.0 xHCI Controller (rev 31)
00:14.2 Signal processing controller: Intel Corporation 100 Series/C230 Series Chipset Family Thermal Subsystem (rev 31)
00:16.0 Communication controller: Intel Corporation 100 Series/C230 Series Chipset Family MEI Controller #1 (rev 31)
00:16.3 Serial controller: Intel Corporation 100 Series/C230 Series Chipset Family KT Redirection (rev 31)
00:17.0 SATA controller: Intel Corporation Q170/Q150/B150/H170/H110/Z170/CM236 Chipset SATA Controller [AHCI Mode] (rev 31)
00:1c.0 PCI bridge: Intel Corporation 100 Series/C230 Series Chipset Family PCI Express Root Port #3 (rev f1)
00:1c.4 PCI bridge: Intel Corporation 100 Series/C230 Series Chipset Family PCI Express Root Port #5 (rev f1)
00:1f.0 ISA bridge: Intel Corporation C236 Chipset LPC/eSPI Controller (rev 31)
00:1f.2 Memory controller: Intel Corporation 100 Series/C230 Series Chipset Family Power Management Controller (rev 31)
00:1f.3 Audio device: Intel Corporation 100 Series/C230 Series Chipset Family HD Audio Controller (rev 31)
00:1f.4 SMBus: Intel Corporation 100 Series/C230 Series Chipset Family SMBus (rev 31)
00:1f.6 Ethernet controller: Intel Corporation Ethernet Connection I219-LM (rev 31)
01:00.0 VGA compatible controller: NVIDIA Corporation GP108 [GeForce GT 1030] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GP108 High Definition Audio Controller (rev a1)
02:00.0 Ethernet controller: Intel Corporation I210 Gigabit Network Connection (rev 03)
03:00.0 PCI bridge: Integrated Technology Express, Inc. IT8893E PCIe to PCI Bridge (rev 41)

2、查看NVIDIA-SMI是否安装

root@apq-K07-C236:/home# nvidia-smi
Command 'nvidia-smi' not found, but can be installed with:
sudo apt install nvidia-utils-435         # version 435.21-0ubuntu7, or
sudo apt install nvidia-utils-440         # version 440.82+really.440.64-0ubuntu6
sudo apt install nvidia-340               # version 340.108-0ubuntu5.20.04.2
sudo apt install nvidia-utils-390         # version 390.157-0ubuntu0.20.04.1
sudo apt install nvidia-utils-450-server  # version 450.248.02-0ubuntu0.20.04.1
sudo apt install nvidia-utils-470         # version 470.256.02-0ubuntu0.20.04.1
sudo apt install nvidia-utils-470-server  # version 470.256.02-0ubuntu0.20.04.1
sudo apt install nvidia-utils-535         # version 535.183.01-0ubuntu0.20.04.1
sudo apt install nvidia-utils-535-server  # version 535.183.01-0ubuntu0.20.04.1
sudo apt install nvidia-utils-550-server  # version 550.90.07-0ubuntu0.20.04.2
sudo apt install nvidia-utils-418-server  # version 418.226.00-0ubuntu0.20.04.2
说明驱动没有部署

root@apq-K07-C236:/home# sudo ubuntu-drivers devices
反馈如下:
== /sys/devices/pci0000:00/0000:00:1c.4/0000:02:00.0 ==
modalias : pci:v000010DEd00001D01sv000010DEsd000011E6bc03sc00i00
vendor   : NVIDIA Corporation
model    : GP108 [GeForce GT 1030]
driver   : nvidia-driver-470-server - distro non-free
driver   : nvidia-driver-470 - distro non-free
driver   : nvidia-driver-535 - distro non-free recommended
driver   : nvidia-driver-450-server - distro non-free
driver   : nvidia-driver-418-server - distro non-free
driver   : nvidia-driver-390 - distro non-free
driver   : nvidia-driver-535-server - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

可以选择recommended 的驱动部署
也可以使用sudo ubuntu-drivers autoinstall安装驱动

3、安装驱动

root@apq-K07-C236:/home/apq# sudo ubuntu-drivers autoinstall
正在读取软件包列表... 完成
正在分析软件包的依赖关系树... 完成
正在读取状态信息... 完成                 
将会同时安装下列软件:
  libatomic1:i386 libbsd0:i386 libdrm-amdgpu1:i386 libdrm-intel1:i386 libdrm-nouveau2:i386 libdrm-radeon1:i386 libdrm2:i386 libedit2:i386 libelf1:i386 libexpat1:i386 libffi8:i386
  libgl1:i386 libgl1-mesa-dri:i386 libglapi-mesa:i386 libglvnd0:i386 libglx-mesa0:i386 libglx0:i386 libicu70:i386 libllvm15:i386 libmd0:i386 libnvidia-cfg1-535 libnvidia-common-535
  libnvidia-compute-535 libnvidia-compute-535:i386 libnvidia-decode-535 libnvidia-decode-535:i386 libnvidia-encode-535 libnvidia-encode-535:i386 libnvidia-extra-535 libnvidia-fbc1-535
  libnvidia-fbc1-535:i386 libnvidia-gl-535 libnvidia-gl-535:i386 libpciaccess0:i386 libsensors5:i386 libstdc++6:i386 libvdpau1 libx11-6:i386 libx11-xcb1:i386 libxau6:i386
  libxcb-dri2-0:i386 libxcb-dri3-0:i386 libxcb-glx0:i386 libxcb-present0:i386 libxcb-randr0:i386 libxcb-shm0:i386 libxcb-sync1:i386 libxcb-xfixes0:i386 libxcb1:i386 libxdmcp6:i386
  libxext6:i386 libxfixes3:i386 libxml2:i386 libxnvctrl0 libxshmfence1:i386 libxxf86vm1:i386 linux-modules-nvidia-535-6.8.0-40-generic mesa-vdpau-drivers nvidia-compute-utils-535
  nvidia-firmware-535-535.183.01 nvidia-kernel-common-535 nvidia-kernel-source-535 nvidia-prime nvidia-settings nvidia-utils-535 pkg-config screen-resolution-extra vdpau-driver-all
  xserver-xorg-video-nvidia-535
建议安装:
  lm-sensors:i386 libvdpau-va-gl1
推荐安装:
  libgl1-amber-dri:i386
下列【新】软件包将被安装:
****************************************************************
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-6.8.0-40-generic
Found initrd image: /boot/initrd.img-6.8.0-40-generic
Found linux image: /boot/vmlinuz-6.5.0-44-generic
Found initrd image: /boot/initrd.img-6.5.0-44-generic
Memtest86+ needs a 16-bit boot, that is not available on EFI, exiting
Warning: os-prober will not be executed to detect other bootable partitions.
Systems on them will not be added to the GRUB boot configuration.
Check GRUB_DISABLE_OS_PROBER documentation entry.
Adding boot menu entry for UEFI Firmware Settings ...
done

4、切换驱动

部署完毕后,继续使用nvidia-smi
如果出现
NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.

说明驱动可能没有切换到专用驱动,仍然使用的是开源驱动
prime-select query
以下是一些可能的输出和它们的含义:
 nvidia :系统默认使用NVIDIA专有驱动。
 nouveau :系统默认使用开源nouveau驱动。
 on-demand :系统默认使用nouveau驱动,但会按需切换到NVIDIA专有驱动。

这个时候,需要进行驱动切换
命令为 sudo prime-select nvidia

切换后基本就可以使用SMI

5、NVIDIA-SMI相关命令

基本用法:
nvidia-smi
这条命令会显示所有 NVIDIA GPU 的基本信息,包括 GPU 名称、总内存、已用内存等。

显示详细信息:
nvidia-smi -q
这条命令会显示每个 GPU 的详细信息,包括温度、功耗、风扇转速、驱动程序版本等。

显示 GPU 利用率:
nvidia-smi --query-gpu=utilization.gpu --format=csv
这条命令会显示 GPU 的利用率百分比。

持续监控 GPU 状态:
nvidia-smi --loop=2000
这条命令会每隔 2 秒刷新一次 GPU 状态信息。

设置日志文件输出:
nvidia-smi --loop=2000 --log-file=nvidia_smi_log.csv
这条命令会每隔 2 秒记录一次 GPU 状态信息,并将其写入指定的日志文件。

显示 GPU 温度:
nvidia-smi --query-gpu=temperature.gpu --format=csv
这条命令会显示 GPU 的温度。

显示 GPU 内存使用情况:
nvidia-smi --query-gpu=memory.used,memory.total --format=csv
这条命令会显示 GPU 的已用内存和总内存。

显示 GPU 时钟频率:
nvidia-smi --query-gpu=clocks.gr --format=csv
这条命令会显示 GPU 的图形时钟频率。

显示 GPUPID 和进程信息:
nvidia-smi --query-compute-apps=pid,gpu_name,process_name --format=csv
这条命令会显示使用 GPU 的进程 IDGPU 名称和进程名称。

设置 GPU 的时钟频率:
nvidia-smi -i 0 -cgb 2505
这条命令会设置 GPU 编号 0 的图形时钟频率为 2505 MHz。

设置 GPU 的最大性能状态:
nvidia-smi -i 0 -pbr
这条命令会将 GPU 编号 0 的性能状态设置为最大。

设置 GPU 的电源限制:
nvidia-smi -i 0 -pl 150
这条命令会将 GPU 编号 0 的电源限制设置为 150W。

设置 GPU 的风扇速度:
nvidia-smi -i 0 -fan=60
这条命令会将 GPU 编号 0 的风扇速度设置为 60%。

设置 GPU 的显存超频:
nvidia-smi -i 0 -mem 1000
这条命令会将 GPU 编号 0 的显存频率设置为 1000 MHz。

显示 GPUECC 错误:
nvidia-smi -q | grep ECC
这条命令会显示 GPUECC 错误信息。

显示 GPUPCI-Bandwidth:
nvidia-smi -q | grep PCI
这条命令会显示 GPUPCI-Bandwidth 信息。

显示 GPU 的多处理器计数:
nvidia-smi -q | grep Multi
这条命令会显示 GPU 的多处理器计数信息。

显示 GPU 的总线 ID:
nvidia-smi -q | grep Bus
这条命令会显示 GPU 的总线 ID 信息。

显示 GPU 的驱动版本:
nvidia-smi -q | grep Driver
这条命令会显示 GPU 的驱动版本信息。

显示 GPU 的序列号:
nvidia-smi -q | grep Serial
这条命令会显示 GPU 的序列号信息。

显示 GPUBIOS 版本:
nvidia-smi -q | grep BIOS
这条命令会显示 GPUBIOS 版本信息。

显示 GPUVBIOS 版本:
nvidia-smi -q | grep VBIOS
这条命令会显示 GPUVBIOS 版本信息。

显示 GPU 的温度阈值:
nvidia-smi -q | grep Thermal
这条命令会显示 GPU 的温度阈值信息。

显示 GPU 的时钟状态:
nvidia-smi -q | grep Clocks
这条命令会显示 GPU 的时钟状态信息。

显示 GPU 的板载内存大小:
nvidia-smi -q | grep Memory
这条命令会显示 GPU 的板载内存大小信息。

显示 GPU 的电源管理状态:
nvidia-smi -q | grep Power
这条命令会显示 GPU 的电源管理状态信息。

显示 GPU 的风扇状态:
nvidia-smi -q | grep Fan
这条命令会显示 GPU 的风扇状态信息。

显示 GPU 的显存类型:
nvidia-smi -q | grep Memory.Type
这条命令会显示 GPU 的显存类型信息。

显示 GPU 的显存带宽:
nvidia-smi -q | grep Memory.Bandwidth
这条命令会显示 GPU 的显存带宽信息。

显示 GPU 的显存位宽:
nvidia-smi -q | grep Memory.Width
这条命令会显示 GPU 的显存位宽信息。

显示 GPU 的显存时钟频率:
nvidia-smi -q | grep Memory.Clock
这条命令会显示 GPU 的显存时钟频率信息。

显示 GPU 的显存时钟单位:
nvidia-smi -q | grep Memory.ClockUnit
这条命令会显示 GPU 的显存时钟单位信息。

显示 GPU 的显存类型:
nvidia-smi -q | grep Memory.Type
这条命令会显示 GPU 的显存类型信息。

显示 GPU 的显存大小:
nvidia-smi -q | grep Memory.Total
这条命令会显示 GPU 的显存大小信息。

显示 GPU 的显存已用大小:
nvidia-smi -q | grep Memory.Used
这条命令会显示 GPU 的显存已用大小信息。

显示 GPU 的显存空闲大小:
nvidia-smi -q | grep Memory.Free
这条命令会显示 GPU 的显存空闲大小信息。

显示 GPU 的显存已分配大小:
nvidia-smi -q | grep Memory.Allocated
这条命令会显示 GPU 的显存已分配大小信息。

显示 GPU 的显存未分配大小:
nvidia-smi -q | grep Memory.Unallocated
这条命令会显示 GPU 的显存未分配大小信息。

显示 GPU 的显存已缓存大小:
nvidia-smi -q | grep Memory.Cached
这条命令会显示 GPU 的显存已缓存大小信息。

显示 GPU 的显存未缓存大小:
nvidia-smi -q | grep Memory.Uncached
这条命令会显示 GPU 的显存未缓存大小信息。

查看完整的文档以获取更多详细信息。
man nvidia-smi 
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小桃子的思念

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值