MDCNCMNET网核心设备

10G板卡升级总结

 

割接工作概述

为满足南方基地OA网及CMNET网的出口带宽需求,按照园区办公网规划设计,拟以10G线路替代现有临时1G出口线路。本次升级分为OA网核心层升级和CMNET网核心层升级。升级涉及到的设备有:Juniper SRX3400防火墙、华为S9303交换机、华为NE40E和思科6509

 

角色及负责范围

身份不明。负责范围:

1)  方案的审核

2)  协调呼叫中心及其他各栋楼层之间的网络测试

3)  板卡的拿取

时间地点

  201171日晚上22:302.32201核心机房进行板卡升级

准备工作:

1、割接方案提前了一个月,设备状态进行了备份,设备硬件

2、对需要的硬件提前进行了准备

3、对割接代码进行了准备

4、对割接步骤、接线步骤进行了讨论和规划

5、对割接厂家的代码进行了审核、汇总

割接出现问题:

核心93交换机和防火墙端口无法传输数据,无法建立ospf邻居关系

出现问题次数:2

出现问题解决办法:

1、多次插拔光口、进行了删除配置,无效

2、还原配置操作,能正常传输数据,建立ospf邻居关系,证明设备之间的物理层是正常的

3、重新启动了2台华为交换机,无效

4、重新启动了2台防火墙,故障解决

 

可能导致该问题的原因:

核心93交换机和防火墙互联光纤单向数据链路故障,无法建立ospf邻居,以下是当天晚上割接,进行ping包的数据,只有去防火墙的包,没有返回包:

[B2.3-2F-S9303-OA-HX-2]ping 10.251.91.18

  PING 10.251.91.18: 56  data bytes, press CTRL_C to break    Request time out

    Request time out

    Request time out

    Request time out

    Request time out

 

  --- 10.251.91.18 ping statistics ---

    5 packet(s) transmitted

    0 packet(s) received

[描述1] 100.00% packet loss

以下是当天晚上ospf建立邻居失败的日志:

#Jul  2 01:26:45 2011 B2.3-2F-S9303-OA-HX-1 OSPF/4/IFCHG:OSPF TrapID1.3.6.1.2.1.14.16.2.16: Non-virtual interface 10.251.91.17 0 Router 10.251.90.1 state change to 1.

#Jul  2 01:26:45 2011 B2.3-2F-S9303-OA-HX-1 OSPF/4/NBRCHG:OSPF TrapID1.3.6.1.2.1.14.16.2.2: Non-virtual neighbor 10.251.91.18 0 Router 10.251.90.1 NbrRouter 10.251.91.18 state change to 1.

#Jul  2 01:26:46 2011 B2.3-2F-S9303-OA-HX-1 OSPF/4/IFCHG:OSPF TrapID1.3.6.1.2.1.14.16.2.16: Non-virtual interface 10.251.91.17 0 Router 10.251.90.1 state change to 4.

Jul  2 2011 01:26:46 B2.3-2F-S9303-OA-HX-1 %%01OSPF/3/NBR_CHG_DOWN(l): Neighbor event:neighbor state changed to Down. (ProcessId=1, NeighborAddress=10.251.91.18, NeighborEvent=KillNbr, NeighborPreviousState=Init, NeighborCurrentState=Down)

Jul  2 2011 01:26:46 B2.3-2F-S9303-OA-HX-1 %%01OSPF/3/NBR_CHG_DOWN(l): Neighbor event:neighbor state changed to Down. (ProcessId=1, NeighborAddress=10.251.91.19, NeighborEvent=KillNbr, NeighborPreviousState=Full, NeighborCurrentState=Down)

割接不足及解决办法:

1、割接责任人不清晰,开始撰写割接方案时,以为是网络组进行割接,到最后一周才了解是厂家实施,网络组配合。以后割接首先需要明确割接责任方。

2、只准备了数据和业务测试,没准备完备的测试方案(好ping包,且存盘分析等)。对割接测试需要提供完备的log

3、割接御寒衣物准备不足,导致割接多人受冻。机房割接需要准备好足够的外套。

4、没有对割接可能出现的故障进行设想,出现故障后,反映较慢。需要对可能出现故障及如何解决进行准备,提前准备备件,一旦出现硬件故障可以及时替换。

5、对防火墙设备升级速度及重新启动速度不了解。需要对设备升级时间进行评估。

 


 [描述1]只有发包,无返回包

 

PS:这个具体方案的话 我就不上传了 因为涉及到了一些核心数据