zabbix事件告警监控:如何实现对相同部件触发器告警及恢复的强关联

有一定Zabbix使用经验的小伙伴可能会发现,接收告警事件时,其中可能包含着大量不同的部件名,同一部件的事件在逻辑上具有很强关联性,理论上应保持一致的告警/恢复状态,但Zabbix默认并未对它们进行关联,直接后果是运维人员只能进行大量重复操作,进而对部件的状态进行校正。

实际上,虽然Zabbix默认未对相同部件进行关联,但却可以通过手动配置实现关联操作。本文将深入探讨Zabbix在处理相同部件触发器的告警和恢复过程中的强关联机制。通过这种机制,我们可以确保一旦触发器状态发生变化,相关的告警能够被准确触发,并且在问题解决后,告警状态能够及时恢复,从而避免无效告警的干扰和资源的浪费。

例如,当前监控中有对硬件设备事件采集监控项(数据如下),要对其配置触发器告警,但是每个事件中包含告警对应的部件名,希望对相同部件的告警实现告警-恢复事件的自动关联。在这里插入图片描述
数据字段解析:

监控取值中,第4位为告警状态,"Assertion"表示告警产生,"Deassertion"表示告警恢复。

配置思路:
方法一(建议):
参考方法二中基础配置,额外补充事件匹配-标签
在这里插入图片描述
标记中“值“参数支持写法如下

{{ITEM.VALUE}.regsub(pattern, output)}

{{ITEM.VALUE}.iregsub(pattern, output)}

{{#LLDMACRO}.regsub(pattern, output)}

{{#LLDMACRO}.iregsub(pattern, output)}

图中示例写法:

{{ITEM.VALUE}.regsub(“tion”,\s*“\s*(\S+)\s*(”,\1)}

测试数据如下:
在这里插入图片描述
测试结果:在这里插入图片描述
从结果中可以看到,部件名称被正则截取到标记中。

同时,只有DIMM110 是既存在”Assertion”记录,又存在”Deassertion”记录的,所以只有DIMM110部件的告警是恢复了的。

优点:

1.配置简单,仅配置一条即可

2.告警事件不遗漏,多个部件告警信息,则产生多个告警事件

3.可以实现单个部件的告警、恢复记录的关联,不会因为其他此部件的恢复记录,触发其他部件告警的恢复操作

缺点:

1.配置逻辑较复杂,涉及标记、正则、内置宏等多方面

方法二:
配置单个触发器,如下图2

①将告警最新值带进告警标题中,区分具体告警部件等信息。

②检测到关键字"Assertion"则告警

③检测到关键字"Deassertion"则恢复

④问题事件生成模式:多重:触发器未恢复的情况下可以多次产生告警;单个:多次规则匹配,如果已经产生的告警为恢复的情况下,不会重新产生新告警。效果如下图3

在这里插入图片描述
在这里插入图片描述
优点:

  1. 配置简单,仅配置一条即可

  2. 告警事件不遗漏,多个部件告警信息,则产生多个告警事件

缺点:

1.一个部件告警恢复,则其他部件告警一并恢复,如图4 —— 仅DIMM131部件恢复,其他部件的告警也被恢复了,其实并没有在这里插入图片描述

方法三:
对每个部件添加一个触发器(如下图5):

DIMM110部件告警触发器:

触发表达式:监控值包含DIMM110 且 包含关键字 “Assertion”;

恢复表达式:监控值包含DIMM110 且 包含关键字 “Deassertion”;

反复操作,添加DIMM111、DIMM120、DIMM121等多个触发器。

在这里插入图片描述
图5

优点:

1.可以实现单个部件的告警、恢复记录的关联,不会因为其他此部件的恢复记录,触发其他部件告警的恢复操作

缺点:

1.配置工作量巨大,每个部件都需要定义一个对应触发器

2.可能会丢失、遗漏告警,因为可能部件关键字未加入触发器中

结论:
上述三种方法可以看出,逻辑上方法二、方法三更加简单明了,但是皆有不满足场景需求的情况;方法一则更贴合场景需求,且善用触发器的标记功能,也更利于监控平台的维护管理。参考该第一方法,可延伸较多场景,如日志事件告警恢复ID关联、snmptrap端口up\down数据告警关联、硬件事件相同部件名告警恢复关联、远程登入登出记录关联等。

以上就是这一期Zabbix技术分享。大家好,我是乐乐,专注运维技术研究与分享,关注我学习更多Zabbix使用技巧,更多问题也欢迎到乐维社区进行留言。

  • 21
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
课程目标     全面理解和掌握 Zabbix 监控系统的架构及运行原理,搭建和管理各种规模的Zabbix监控系统 课程简介         Zabbix是一个开源的企业级的监控解决方案。通过Zabbix可以监控IT基础设施的方方面面,包括硬件、操作系统、网络、虚拟化层、中间件和各种业务应用系统。用Zabbix几乎可以监控你想监控的任意数据。              本课程从Zabbix的介绍、安装开始,一步步带你深入Zabbix,通过学习你会:         1、掌握Zabbix各个组件的配置和管理。         2、掌握不同监控项的类型和配置方法,根据监控需求灵活配置监控项。         3、掌握网络发现、低级发现和主动式agent自动注册,实现自动化监控。         4、掌握模版、宏变量、触发器告警通知的配置和高级的应用方法。         5、掌握图形、屏幕、拓扑图和仪表盘等数据可视化的方法,利用大屏可以实时的展示监控数据。         6、掌握Zabbix系统自身的维护、备份、升级、排障以及性能优化。         7、掌握Zabbix内部运行机制和Zabbix使用技巧,让zabbix更好的帮助你实现监控目标。                  本课程中还包含很多操作演示,比如像创建主机,创建监控项、触发器、图形、全局事件关联等,也介绍了微信和钉钉告警的配置方法。当你对Zabbix深入了解之后,面对层出不穷的新业务、新应用,你都能轻松自如的制定和提供相应的监控解决方案。 特别提示:官网的中文文档有些地方翻译的有问题,一定要以英文文档为准。
Zabbix 是一个企业级分布式开源监控解决方案。  Zabbix 软件能够监控众多网络参数和服务器的健康度、完整性。Zabbix 使用灵活的告警机制,允许用户为几乎任何事件配置基于邮件的告警。这样用户可以快速响应服务器问题。Zabbix 基于存储的数据提供出色的报表和数据可视化功能。  Zabbix 支持主动轮询(polling)和被动捕获(trapping)。Zabbix所有的报表、统计数据和配置参数都可以通过基于 Web 的前端页面进行访问。基于 Web 的前端页面确保您可以在任何地方访问您监控的网络状态和服务器健康状况。适当的配置后,Zabbix 可以在监控 IT 基础设施方面发挥重要作用。无论是对于有少量服务器的小型组织,还是拥有大量服务器的大企业而言,同样适用。  Zabbix 是免费的。Zabbix 是根据 GPL 通用公共许可证的第二版编写和发布的。这意味着产品源代码是免费发布的,可供公共使用。 本课程主要讲解以下方面:1.  触发器的表达式的以及事件标签的配置。2.  触发器动作和报警升级。3.  监控模板的创建及管理。4.  高级监控项的使用以及自动化配置。5.  web页面的简单监控。 注意:该课程,需要有一定的 zabbix 和 Linux 基础,建议您先把>看完,再看此套课程,这个是在它的基础上进行讲解的。                                                                                                                                                                                                                                                                                               
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值