1、Node_exporter监控agent存活
PromQL语句:
up{job="捷顺监控"} == 0
说明:检测Node_exporter监控agent是否存活、或者是Node_exporter服务是否挂掉
2、Node_exporter监控CPU利用率
PromQL语句:
ceil(100 - sum(increase(node_cpu_seconds_total{job="捷顺监控",mode="idle"}[5m])) by(instance) / sum(increase(node_cpu_seconds_total{job="捷顺监控"}[5m])) by(instance)*100) >= 80
说明:监控服务器的CPU利用率,如果大于80%就告警
3、Node_exporter监控磁盘利用率
PromQL语句:
round((1 - (node_filesystem_avail_bytes{fstype=~"ext3|ext4|xfs|nfs",job="捷顺监控"} / node_filesystem_size_bytes{fstype=~"ext3|ext4|xfs|nfs",job="捷顺监控"})) * 100) >= 80
说明:监控服务器的磁盘利用率,如果大于80%就告警
4、Node_exporter监控内存利用率
PromQL语句:
ceil((1 - (node_memory_MemAvailable_bytes{job="捷顺监控"} / (node_memory_MemTotal_bytes{job="捷顺监控"})))* 100 ) >= 80
说明:监控服务器的内存利用率,如果大于80%就告警
5、Node_exporter监控服务器负载情况
PromQL语句:
node_load1{job="捷顺监控"} >=50
说明:监控服务器的服务器负载情况,如果大于50就告警
6、Node_exporter监控服务器文件句柄使用
PromQL语句:
node_filefd_allocated{job="捷顺监控"} >=50000
说明:监控服务器的文件句柄使用情况,如果大于50000就告警
7、Node_exporter监控服务器等待关闭的TCP连接数
PromQL语句:
node_sockstat_TCP_tw{job="捷顺监控"} >=5000
说明:监控服务器等待关闭的TCP连接数情况,如果大于5000就告警
8、Node_exporter监控服务器入口流量
PromQL语句:
round((sum
by(instance) (irate(node_network_receive_bytes_total{device!~"tap.*|veth.*|br.*|docker.*|virbr*|lo*",job="捷顺监控"}[5m])))
/ 1024 / 1024) > 50
说明:监控服务器入口流量情况,如果入口流量大于50M就告警
9、Node_exporter监控服务器出口流量
PromQL语句:
round((sum
by(instance) (irate(node_network_transmit_bytes_total{device!~"tap.*|veth.*|br.*|docker.*|virbr*|lo*",job="捷顺监控"}[5m])))
/ 1024 / 1024) > 50
说明:监控服务器出口流量情况,如果出口流量大于50M就告警