贴合运维业务场景的告警聚合实现——以Zabbix为例

本文介绍了如何利用Zabbix和Argus平台实现告警聚合,以减少运维人员的告警骚扰。通过在Argus中设置事件聚合规则和消息分派规则,将告警消息按业务需求进行收敛,简化通知并保持贴近实际业务。
摘要由CSDN通过智能技术生成

本文介绍了一种基于Zabbix实现贴合业务场景的告警聚合的方法。

本方法的思路是通用的,并不局限于某一具体的软件。

注意,具体的参数可以根据实际情况进行设置和选用,文中所述仅是一种示例。

1. 引言

1.1 背景

IT运维怕什么?告警。而告警洪灾更是噩梦,正愉快写着文档时猛然来了无数个夺命连环Call,现在只是稍微想象一下就开始头疼了。

一般来说,告警洪灾的常见原因有:

  • 算法(包括简单的预测算法以及机器学习)的局限性;

  • 告警规则配置不合理;

  • 将过多的指标放入了告警规则中,而其实人并不需要对它们进行处理;

  • 告警阈值过于苛刻;

  • 外部通知(邮件、企业微信等)过于零散;

初步分析:

算法的局限性

现实情况复杂多变,比如节日的抢购或甚至临时上线的活动,而有时网络波动也会导致数据异常进而误触发告警。

当然,长期的机器学习以及算法的进步应该能缓解这一问题,但较短时间内难以看到成效,而且可能会起到反作用。目前它还更多的是在探索试用阶段,本文暂不对此进行讨论。

告警规则配置不合理

不论是将过多的指标放入了告警规则中,还是告警阈值过于苛刻,都是因为开始的时候会担心错过了告警,追求大而全的监控和告警配置。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值