如何解决zabbix proxy 无法访问zabbix server时产生的大量zabbix agent不可达告警

zabbix proxy通过公网访问zabbix server,有时会出现公网不稳定的情况,导致zabbix proxy无法访问zabbix server。

这时会产生大量zabbix agent不可达告警。如何解决这个问题?

 

我们可以在zabbix proxy上添加一个监控项及触发器zp2zs,探测zabbix server的网络连通性。

zabbix proxy下的所有的zabbix agent不可达触发器都依赖这个zp2zs触发器即可。

这设计到跨主机告警依赖。目前似乎只能在每个zabbix agent上分别添加告警依赖。无法在模板中使用跨主机告警依赖。

 

zp2zs这个触发器应该遵循“快速失败,延迟恢复”的原则。如连续2分钟都失败则告警,连续10分钟正常才恢复。

触发器表达式如下:

({TRIGGER.VALUE}=0 and {Template xxxx:net.tcp.port[xxxx,xxxx].count(#2,0,eq)}=2) or ({TRIGGER.VALUE}=1 and {Template xxxx:net.tcp.port[xxxx,xxxx].count(#10,0,eq)}>0)

 

但是还有一种情况可能导致整个告警风暴。proxy 和 agent之间出现问题。

针对整个问题,我们可以在其中一台主机上添加一个触发器。整个触发器涉及到几台主机,只要其中一台agent.ping没有数据即告警,时间应该抢在常规的5分钟没数据即告警之前,比如设置为4分钟。

然后所有主机的主机不可达触发器再依赖这个触发器,就可以达到收敛告警的效果。

这个触发器表达式如下:

({TRIGGER.VALUE}=0 and ({xxxx:agent.ping.nodata(4m)}=1 or {xxxx:agent.ping.nodata(4m)}=1)) or ({TRIGGER.VALUE}=1 and ({xxxx:agent.ping.count(15m,1)}<15 or {xxxx:agent.ping.count(15m,1)}<15))

转载于:https://www.cnblogs.com/memoryredbook/p/7209592.html

Zabbix 是一个企业级分布式开源监控解决方案。 Zabbix 软件能够监控众多网络参数和服务器的健康度、完整性。Zabbix 使用灵活的告警机制,允许用户为几乎任何事件配置基于邮件的告警。这样用户可以快速响应服务器问题。Zabbix 基于存储的数据提供出色的报表和数据可视化功能。 Zabbix 支持主动轮询(polling)和被动捕获(trapping)。Zabbix所有的报表、统计数据和配置参数都可以通过基于 Web 的前端页面进行访问。基于 Web 的前端页面确保您可以在任何地方访问您监控的网络状态和服务器健康状况。适当的配置后,Zabbix 可以在监控 IT 基础设施方面发挥重要作用。无论是对于有少量服务器的小型组织,还是拥有大量服务器的大企业而言,同样适用。 Zabbix 是免费的。Zabbix 是根据 GPL 通用公共许可证的第二版编写和发布的。这意味着产品源代码是免费发布的,可供公共使用。主要讲解8个主题:1.     通过SNMP防火墙设备的监控2.     通过SNMP交换机设备的监控3.     对Windows的性能、服务、用户登陆监控4.     对Linux的性能、用户登陆情况进行监控5.     生产中常用的服务进行监控,如nginx,httpd,mysql,ceph,bind等6.     Zabbix分布式的部署和监控7.     常见的zabbix三种报警方式8.     使用grafana对zabbix中的数据进行展示
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值