前言
今天醒来通过微信,看到了客户环境的深信服上网行为管理(AC)在凌晨1点30左右发生了告警信息,说这台设备重启了。但通过设备的Web端查看设备的流量情况,是没有进行重启的。
微信告警信息:
排查思路:
一、查看设备中的流量信息
###由于深信服的无线上网行为管理在Web端的管理界面上无法直观的看到设备的运行时间,现在我们查看有时间节点,可以反应出设备没有发生过重启的图
###可以看到,在2019-12-19的凌晨1点30往后或者往前,流量都是有的,现在就可以确定是Zabbix监控项的问题了
二、查看Zabbix的监控项
###对应微信告警查看Zabbix上的监控项,并且在Zabbix系统上使用snmpwalk进行测试
###监控项为Device uptime,获取OID,使用snmpwalk进行测试
###使用snmpwalk对OID进行测试
###可以看到,这个OID的描述就是sysUpTimeInstance(系统启动时间),值就是 8:58:58.00
###合起来理解就是:系统已经启动了8个小时,58分钟,58秒了
###但是也不对啊,明明没有发生重启的,为什么这么短呢
三、查看深信服上网行为管理的MIB库文件
###系统管理–系统配置–高级配置–SNMP设置–下载MIB库
###使用MIB库解析软件打开设备MIB库文件
###找到sangfor文件夹
###查看了一下,并没有一个代表设备运行时间的OID
###解释一下general文件夹下的都是一些比较常用的OID,例如:
sfDeviceDescr:设备名称和型号
sfSysDate: 设备的日期时间
sfSysCpuCostRate:设备CPU当前的使用率
sfSysFreeMemory:设备的空闲内存
sfDiskTable:设备磁盘的相关信息
cpuLoadAvg:这一个文件夹下记录的是CPU,1分钟,5分钟,15分钟的平均负载
sfSysTotalMemory:设备的总内存大小(有单位,MB)
sfSysFreeMemoryNoUnit:设备的可用内存
sfSysTotalMemoryNoUnit:设备的总内存大小(无单位)
###结合设备的MIB文件与设备的Web端管理界面得出,深信服的上网行为管理无法监控设备的运行时间。
四、优化Zabbix模板监控项
禁用监控模板中的Device uptime监控项