更多文章请移步:www.yanjun.pro
1、告警工作流程
-
告警概述
告警是监控的重要职能,是指将达到某一阈值事件的消息发送给用户,让用户在事件发生后即可知道监控指标是否超过规定阈值,从而决定是否采取相关措施处理故障
-
告警流程
首先是触发器达到规定阈值,然后action对事件信息进行处理,一方面是给用户发送告警信息,另一方面是执行相关命令,达到对事件故障自动尝试恢复的效果
-
zabbix告警配置步骤
- 配置trigger(触发器)
- 配置用户
- 配置告警方式
- 配置action(动作)
2、告警触发器(trigger)配置
2.1、trigger的作用
trigger是一组逻辑条件表达式,用于item在其更新周期内所产生的数据与目标阈值是否相同。在zabbix-server首次启动过程中,会将host、template、trigger、items等数据全部加载到内存缓存中,因此zabbix-server进程在收到每个item所产生的数据后,会立即在缓存中查找该item是否配置有trigger表达式,如果配置有,则将trigger表达式的阈值与当前item的数据进行比较,若满足阈值,则判断当前item处于故障(problem)状态;若不满足阈值,则处于正常(OK)状态
2.2、trigger的故障等级定义
trigger故障等级分为 p0 ~ p5 六个等级
- p0:灾难级别,该级别为重大故障,涉及到核心业务的正常运行
- p1:危险级别,该级别为危险级别,涉及到应用的正常运行
- p2:一般级别,对系统有影响,但不涉及致命危险的故障
- p3:警告级别,可能对系统具有影响的故障
- p4:信息级别:不影响系统正常运行状态的故障
- p5:不通知:一般用于测试告警
2.3、trigger配置步骤
trigger配置步骤为:【configuration】 —> 【hosts】/【templates】 —> 【triggers】 —> 【create trigger】
-
配置参数说明