银行交换机服务器维护,某银行客户使用第三方网管纳管华为S7706交换机后网管时断时续的问题...

1、首先登陆问题交换机S7706,查找对应log日志,发现设备上存在大量长期的snmp认证告警,从2018年至2020年的日志中都发现“Failed to login through SNMP,Reason=the community was incorrect”的告警,如下图:

EKB1100047832

2、按照报错信息,查找相关产品手册,发现该问题属于设备与网管的SNMP 参数不一致导致,与客户沟通后,客户确认设备的SNMP v2秘钥与网管系统部署一致,随后在设备以及网管系统同时修改秘钥,进行SNMP v2测试,显示正常,但存在测试5次,会有3次测试失败的情况。

3、分析设备组网,初步判断是网络中报文转发中出现问题,故先在网管服务器远程进行抓包确认,看是否收到设备发送的正常的SNMP报文,通过抓包发现,异常交换机的SNMP信息在网管服务器的抓包中,搜索目标地址为交换机loopback地址时,发现大量服务器发给交换机的报文,并且其community值与设置的一致,但是没有收到该交换机的任何对应;搜索报文中源地址为交换机loopback地址时,没有任何数据报文,但是正常的设备互通的时候,可以在报文中发现大量的交互报文。

服务器侧发给正常设备的报文:

EKB1100047832

服务器侧正常设备与服务器的回复报文:

EKB1100047832

服务器侧发给异常设备的报文:

EKB1100047832

服务器侧异常设备与服务器的回复报文:

EKB1100047832

4、从上述报文发现,服务器侧并没有收到问题交换机回复的snmp报文,而服务器正常给交换机发送了snmp报文,故需要在交换机侧进行抓包排查,确认报文是否到达交换机,并且交换机是否正常处理报文。

5、在故障交换机配置端口镜像,通过抓包发现异常情况,发现从网管服务器给问题交换机的两个地址(一个loopback地址,一个是接口地址)不断发送snmp报文,并且community值不一样。

6、随后与客户在其网管系统上搜索接口地址和loopback地址,发现确实存在2个设备,与客户协商就将两台设备删除后,只按照loobpack地址进行设备添加,网管上的状态随后显示正常,并且在设备中不在出现snmp的相关告警,同时进行SNMP认证测试时,状态显示正常,连续测试10次,都测试通过。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值