开源监控系统Zabbix——上海分行应用

背景:
    上海分行原来的监控系统WhatsUp,由于C盘已满,科技部搞网络的人员在清理C盘空间的时候,误将WhatsUp的数据库文件文件删除,导致WhatsUp无法打开,之后由于 缺少升级后的数据库脚本文件,导致在添加监控设备的时候,提示数据库外键有冲突,从而无法插入数据。由于又没有原始的文件,导致WhatsUp彻底无法使 用。故需要一套新的系统来代替,因为Windows下比较好的监控软件都是要付费的,所以,选择开源并且功能非常强大的企业级开源监控软件Zabbix。

Zabbix简介:
    首先,先了解下监控系统的几大组成部分:数据采集——数据存储——数据展示——告警机制。
    其次,Zabbix主要由,server端(用于接受agent传来的数据,并存入数据库)、agent端(用于数据采集)、WebUI端(用于数据展示)、proxy端(用于分布式监控,代理server接受数据,然后集中发往server端);
    第三,Zabbix的server端现在只支持运行在类unix系统上,agent端可以在现市面上能见到的OS都可以运行。因为Zabbix的所有配置基本都是在Web界面完成的,所以,必须先搭建后web服务器。

Zabbix使用环境(上海分行):
    服务器:X3650M3
    RAID类型:raid1
    OS:CentOS6.5
    Web平台:lnmp


Zabbix监控配置流程:
    Host(监控的设备)——Item(监控项)——trigger(触发器)——action(触发监控项后的动作)——media type(告警媒介)——user(告警给相关的人员)

Zabbix监控监控效果展示:

1.

注:上图是Zabbix菜单和导航,下面是监控的总括信息:表示监控设备有87台,其中有4台是出现了问题;监控项有249个;触发器有249个,其中4个被禁用等


2.

注:上图表示监控的主机组,后面的数字表示每个组中设备的数量,若无故障背景颜色是绿色,若是有故障,根据故障的级别分为***,橙色,浅红,深红等。


3.

注:上图表示如果最新出现的20个故障,以及故障原因、发生时间、以及故障持续的时间,还有做出的动作,比如发邮件或微信等!


4.

注:上图是分行的网络拓扑图,OK表示此台设备是可以是好的;其中的连线表示每两台设备之间的连通性,绿色表示连通性正常,红色表示不正常。其中的设备, 以及设备之间的连通性都是自动进行监控的,如若出现问题,绿色的OK就会变为红色的Problem,绿色的连接线就会变为红色的连接线,下面会给出两张对 比图。

5.

注:上图就是出现问题时的图形状态,因为三林支行暂时还没营业,所以我把它设定为“维护状态”,这样就不会发送告警了。


6.

注:上图是设备全部正常的状态图!