Prometheus alertmanager告警收敛 搭建监控系统十(进阶篇)

本文介绍了Prometheus Alertmanager的告警收敛功能,包括分组、抑制、静默和延时四种方式。分组可以将相似警报合并减少通知数量;抑制能消除冗余告警,避免误导排查;静默则允许在特定时间区间内静音部分告警;延时参数确保告警及时且收敛。这些机制有助于优化监控系统的效率和用户体验。
摘要由CSDN通过智能技术生成

告警收敛

Alertmanager收敛提供四种方式:

  • 分组
  • 抑制
  • 静默
  • 延时

分组(group)

分组(group): 将类似性质的警报合并为单个通知

  • 优势:假设有一大堆关于MySQL的告警,但是希望在分析问题时能够针对不同的实例进行,所以可以针对不同实例进行分组。每一个告警都会被分往不同实例分组中去,每一个分组最后都会合成一个消息发送给接收者。所以最后运维人员收到的是一封封邮件,而每一封邮件都是关于一个实例的告警。通过这种方式有效的减少了告警消息数量;每一封邮件都是关于一个实例的告警,这种方式可以帮助运维排查一些问题。

示例:假设MySQL A产生了一个报警,另外一台MySQL B,这台MySQL挂掉了,监控系统检测到IO线程和SQL也挂了。通过ID进行分组,不同的实例分配到不同的分组,最后运维将会收到两条告警消息,一条是关于MySQL A CPU过高的告警;另外一条是关于MySQL B挂掉的告警消息。

  group_by: ['alertname']        # 以标签作为分组依据
  group_wait: 10s                # 分组报警等待时间
  group_interval: 10s            # 发送组告警间隔时间
  repeat_interval: 1h            # 重复告警发送间隔时间

抑制(inhibition)

抑制

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值