说句实话,能远程监控linux服务器GPU状态的开源软件并不多,而且AI绘画又是linux上比较小的应用场景,所以软件不好找。今天调试了二个软件简单对比下:
1. 大炮找蚊子级别的:
Prometheus + Grafana + nvidia_gpu_exporter + 14574面板。安装难度:中上
Prometheus与Grafana都是具有完整架构的应用,所以所以安装过程有点冗长,软件间需要配置,但功能是很强大的,除了对GPU进行完整分析与监测外,还可以以CPU,RAM,网络等进行深层次采集与分析。
2. 小而坚的python小工具
jupyterlab nvdashboard,看名字就知道是专门为nvidia做的python应用,安装可以用pip直接安装,装好后也不用什么配置,具体方法可以看我的另外一篇文章。
界面比较简单直观,想要的内容基本都有了。数据实时率很高,目前来说是AI绘画的绝配了。