prometheus告警流程及相关时间参数说明

说明

用prometheus做监控,从告警事件发生到我们收到告警信息中间经历了很多流程,了解其中的流程及相关的时间配置,就能更及时、高效的获取告警信息。

以下记录下prometheus告警生命周期/流程、相关配置参数和告警案例说明。

prometheus告警生命周期/流程

  1. prometheus定时采集指标数据
  2. prometheus定时计算是否指标触发规则
  3. 触发规则的指标告警状态转为pending,当持续时间超过for指定的时间后,转换为firing,并将告警发送到alertmanager
  4. alertmanager收到告警后,等待一段分组时间,到时间后发送告警;如果该分组又持续收到了告警,会等待一个分组告警间隔时间后,再次为该分组发送告警
  5. 如果该告警一直存在,alertmanager会按照重发间隔来重复发送告警

下面这张图是整个prometheus的流程全景图,能清晰的了解prometheus的告警运转流程。
在这里插入图片描述

时间相关参数

参数名称 说明 默认值 参数所属
scrape_interval 指标数据采集间隔 1分钟 prometheus.yml
evaluation_interval 规则的计算间隔 1分钟
  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值