背景:业务中要监控某个指标,但是服务挂掉后telegraf写不到prometheus中,导致以前的监控项fail。
解决方法:在promSQL中加上 or on() vector(0)
比如(max_over_time({name=~‘log*’}[1h]) or on() vector(0))< 1
在log*一小时内不存在时,返回0,满足小于1的条件,触发告警
背景:业务中要监控某个指标,但是服务挂掉后telegraf写不到prometheus中,导致以前的监控项fail。
解决方法:在promSQL中加上 or on() vector(0)
比如(max_over_time({name=~‘log*’}[1h]) or on() vector(0))< 1
在log*一小时内不存在时,返回0,满足小于1的条件,触发告警