网络监控标准
1.前言
本文从健全网络监控的角度出发,用zabbix开源工具实现对IDC基础网络设备的监控,以下介绍各类型设备的监控项及取值办法。
2.基础监控项
基础监控项为各类型设备都需要添加的监控项,除此之外针对不同设备的特殊性有特殊监控项,具体请看第三章。
2.1 系统级
系统级监控着重于监控网络设备本身的性能与各项信息。
序号 | 监控项 | 数据采集方式 | 触发方式 |
1 | CPU使用率 | OID | 阀值 |
2 | 内存使用率 | OID | 阀值 |
3 | 温度 | OID | 阀值 |
4 | 主备信息 | OID | 状态改变 |
5 | 设备存活 | ICMP | 状态改变 |
6 | 监控存活 | OID | 状态改变 |
7 | 路由数目 | OID | 阀值 |
8 | SLA/NQA状态 | OID |
|
2.2 链路级
链路级监控着重于设备之间的链路监控。
序号 | 监控项 | 数据采集方式 | 触发方式 |
1 | 端口名称 | OID(IF-MIB::ifDescr) | 状态改变 |
2 | 端口状态 | OID(IF-MIB::ifOperStatus) | 状态改变 |
3 | 端口InPut流量 | OID(IF-MIB::ifInOctets) | 阀值 |
4 | 端口OutPut流量 | OID(IF-MIB::ifOutOctets) | 阀值 |
5 | 链路出错导致丢弃的接收包的数目 | OID(IF-MIB::ifInErrors) | 阀值 |
6 | 链路出错导致丢弃的发送包的数目 | OID(IF-MIB::ifOutErrors) | 阀值 |
3.特殊监控项
3.1 交换机
序号 | 监控项 | 数据采集方式 | 触发方式 |
1 | ACL数量 | OID+Discover | 阀值 |
3.2 防火墙
序号 | 监控项 | 数据采集方式 | 触发方式 |
1 | 当前总会话数 | OID | 阀值 |
2 | 新建会话数 | OID | 阀值 |
4.关键链路监控项
IDC交换机端口有成千上万个,一些重要的交换机端口需要我们重点关注,以下交换机端口需要重点监控,可以采用zabbix的Screens功能制成相应图表进行实时数据展示。关键链路与交换机端口的对应关系需要网络工程师提供。
序号 | 监控项 | 解释 |
1 | 机房互联端口 | 各机房互联的交换机端口进出口流量 |
2 | 核心链路 | 各机房核心链路进出口流量 |
3 | 公网链路 | 各机房公网进出口流量 |
5.注意事项
4.1 设备命名
网络设备命名统一按照设备真实名称命名,在添加网络设备的时候,需要用snmpwalk命令取到设备的sysName值进行确认。
4.2 监控模板
由于每一类网络设备的OID值都不相同,为方便进行监控网络设备,按照相同的OID建立统一模板,列如华为CE系列交换机OID值相同,则建立一个模板专门给CE系列交换机使用,这样方便后续监控项的添加。
4.3 触发器
网络设备监控项中有一些需要通过阀值触发Action,阀值的具体数值需要网络工程师给出,阀值的修改及监控项的取消,需获取网络工程师的同意。