Linux下监视NVIDIA的GPU使用情况

在使用TensorFlow跑深度学习的时候,经常出现显存不足的情况,所以我们希望能够随时查看GPU时使用率。如果你是Nvidia的GPU,那么在命令行下,只需要一行命令就可以实现。

1. 显示当前GPU使用情况

Nvidia自带了一个nvidia-smi的命令行工具,会显示显存使用情况:

$ nvidia-smi

输出:
nvidia-smi

2. 周期性输出GPU使用情况

但是有时我们希望不仅知道那一固定时刻的GPU使用情况,我们希望一直掌握其动向,此时我们就希望周期性地输出,比如每 10s 就更新显示。 这时候就需要用到 watch命令,来周期性地执行nvidia-smi命令了。

了解一下watch的功能:

$ whatis watch
 watch(1)        - execute a program periodically, showing output fullscreen

作用:周期性执行某一命令,并将输出显示。

watch的基本用法是:

$ watch [options]  command

最常用的参数是 -n, 后面指定是每多少秒来执行一次命令。

监视显存:我们设置为每 10s 显示一次显存的情况:

$ watch -n 10 nvidia-smi

显示如下:
watch -n 10 nvidia-smi

这样,只要开着这个命令行窗口,就可以每十秒刷新一次,是不是很方便呢?
如果我们希望来周期性地执行其他命令行操作,那么就可以简单地更换后面的nvidia-smi即可,So Cool !

Linux系统中,查看系统中GPU的数量和信息可以使用多种方法,这里介绍几种常用的方法: 1. 使用`lspci`命令: `lspci`是一个列出系统中PCI总线设备的工具。通过这个命令可以查看连接到PCI总线上的GPU设备。在终端中输入以下命令可以查看GPU信息: ```bash lspci | grep -i nvidia ``` 或者 ```bash lspci | grep -i amd ``` 如果系统中安装了NVIDIA或AMD的显卡驱动,上述命令会列出相应的GPU设备。`grep -i`是忽略大小写的搜索。 2. 使用`nvidia-smi`命令: 如果系统中安装了NVIDIA显卡及其驱动,可以使用`nvidia-smi`命令来查看NVIDIA GPU的详细信息。在终端中输入以下命令: ```bash nvidia-smi ``` 这个命令会显示所有NVIDIA GPU的设备编号、GPU使用率、内存使用情况、温度等信息。 3. 使用`lshw`命令: `lshw`是一个列出硬件信息的工具,它能提供比`lspci`更详细的硬件信息。安装并运行`lshw`需要root权限,命令如下: ```bash sudo lshw -C display ``` 这个命令会列出所有的显示设备,包括集成显卡和独立显卡。 4. 使用`glxinfo`命令: `glxinfo`命令可以显示关于OpenGL和X服务器的扩展信息,它也可以间接用来查看GPU信息。在终端中输入以下命令: ```bash glxinfo | grep "OpenGL renderer" ``` 输出的OpenGL渲染器信息会显示GPU的类型。 请注意,以上方法适用于大多数Linux发行版,但是具体输出的信息可能会根据你的系统配置和安装的软件有所不同。
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值