推荐:GPU监控利器——gmonitor
1、项目介绍
gmonitor
是一款专为GPU性能监控而设计的程序,特别是在GNU/Linux系统上运行CUDA程序时非常有用。它实时监测GPU的核心利用率、显存占用、PCI-E和内存总线使用情况以及温度,让你对系统的GPU状态一目了然。由于作者在开发CUDA程序时的个人需求,这个简洁的工具应运而生,并且已经稳定使用了一段时间。
2、项目技术分析
gmonitor
利用nvidia-settings
从NVIDIA驱动中获取统计信息,因此要求你的系统已安装并正确配置了NVIDIA驱动和CUDA环境。它的构建依赖CMake,支持编译成可执行文件安装在 /usr/local/bin
下。此外,gmonitor
还提供了与Optirun
的兼容性选项,以便在Bumblebee环境下运行。
3、项目及技术应用场景
- CUDA开发者:当你需要实时监控CUDA应用程序对GPU资源的利用情况时,
gmonitor
是理想选择。 - 系统管理员:在多GPU环境中,可以便捷地查看所有GPU的状态,及时发现潜在问题。
- 远程工作:通过SSH连接到服务器时,启用
-s
参数仍然能正常显示GPU状态。
4、项目特点
- 轻量级: 相比复杂的系统监控软件,
gmonitor
简单高效,专注于GPU监控。 - 灵活的参数设置:你可以定制刷新率、监控模式和目标GPU,满足个性化需求。
- 跨GPU支持:虽然目前只支持NVIDIA卡,但未来可能扩展至AMD/Intel等其他GPU。
- 易于构建和使用:只需简单的几步,就可以从源代码编译并安装。
使用示例
-
默认参数:
gmonitor
-
监控第一和第三块GPU的最新状态:
gmonitor -d 1 -g 02
-
监测所有四块GPU的历史和当前状态:
gmonitor -d 0 -g 0123
-
每3秒更新一次所有GPU的状态:
gmonitor -d 0 -r 3
总的来说,无论你是经验丰富的CUDA程序员还是需要监控GPU性能的普通用户,gmonitor
都是一个值得信赖的工具,它以简单易用的方式提供关键的GPU监控数据。现在就尝试使用,提升你的GPU管理体验吧!