创建一个 仪表盘,命名为任务失败监控 ((flink_jobmanager_job_uptime)-(flink_jobmanager_job_uptime offset 30s))/100 值 就会是 0,可以配置告警。 用当前的时间,减去 30s 之前的时间 去看一看,如果一样的话,就说明已经挂掉 了。只有挂掉了,才会拿到和上次一样的 点击Alert 设置报警条件