Prometheus GPU 监控
1,Prometheus GPU 监控
2,安装gpu-monitoring-tools
2.1,设置`dcgm-exporter`开机启动
3,Prometheus修改配置
4,grafana
5,使用监控面板`9957`可以切换节点
6,Grafana设置
7,使用`12027`
8,使用GPU-Nodes-Metrics-Nvidia 12639
————————————————
版权声明:本文为CSDN博主「mixboot」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/u010953692/article/details/106575802
Prometheus + Grafana 监控 NVIDIA GPU
DCGM 1.7.2 Downloads (December 2019)
GPU Nodes v2
NVIDIA/gpu-monitoring-tools
NVIDIA DCGM Exporter Dashboard
GPU Nodesby bkeyzers
Integrating with DCGM
安装dcgm
基于DCGM和Prometheus的GPU监控方案 dcgm r采集指标项以及含义
————————————————
版权声明:本文为CSDN博主「mixboot」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/u010953692/article/details/106575802