如何在众多节点和各样指标项中快速找到你关心的节点,通过列表排序是很好的方法。这篇文章中我们来看看NDCAS的节点状态列表:
列表项包括主机名,/分区使用率,Load1m,CPU利用率,内存利用率,磁盘读写速率,网络(包括IB)收发速率,CPU温度及实时运行主频,当然也可以添加你关心的其它指标。
/分区使用率可按进度条显示,超过使用阈值以红色数字显示,并且可排序,一目了然找出使用率最高的几个节点:
CPU利用率及内存利用率显示,可按数值与阈值的不同显示不同的数字颜色或单元格颜色,当然也可以排序:
CPU实际运行主频是多少?哪些节点温度超过了温度阈值?快来看看:
还有哪些指标是你关系的?关注爱算数公众号,获取HPC/AI/大数据技术资料,分享集群运维最佳实践,获取你的专属集群定制化监控报表,快来吧~
http://www.neuentro.com