告警规则:3分钟内的平均耗时是否超过1s
指标说明:耗时,单为是毫秒
PromQL:
avg(avg_over_time(saas_metric_GXXXX[3m])) by (IDC, instance) >1000
特别说明:
上面的分组条件(by后的字段),请根据实际业务需求设置。
如果不需要根据标签分组(分类)告警,则去掉分组条件(by)
示例解读:
假设告警规则为1分钟内的平均耗时超过30ms告警,则下图的场景则会产生2条告警(表达式执行记录一条对应一条告警):