从实际工作经验来看,交换机故障率发生最高的位置往往是端口或连接故障,特别是接入交换机的级联端口。同时,由于级联端口发生故障时,该交换机上的所有计算机与其他网络的通讯全部中断,但是,彼此之间的通讯却不受任何影响(前提是位于同一VLAN),因此,诊断和排除起来相对简单。
1. GBIC插槽损坏
<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" /><?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

  故障现象
某学院校园网采用Cisco Catalyst 4006作为核心交换机,Cisco Catalyst 3550作为接入交换机。某天,位于某教学楼内的一个系办公室人员打来电话,告知其办公室内所有计算机均无法连接到校园网络。
  故障分析
登录到核心交换机Cisco Catalyst 4006,使用“show interface vlan vlan-id”命令,查看了该系所处的VLAN工作状态发现该VLAN工作状态正常,处于“up”状态(如图1所示)。
1 VLAN 处于 up 状态

然后,使用“show interface interface-id”命令,查看了连接该教学楼交换机的端口,发现该模块虽然处于“up”状态,但是,协议却处于“down”状态(如图2所示),这表明GBIC模块工作正常,但与对端交换机端口的连接失败,未能实现彼此之间的通讯。
2 协议处于“down ”状态
试着使用“no shutdown”命令启用该端口未果,怀疑是GBIC模块或插槽损坏。于是,到核心交换机处查看端口的LED指示灯,发现该插槽LED指示灯熄灭。表明可能是链路故障,或者GBIC模块或插槽故障。先更换了本端的GBIC模块,又更换了一个空闲的GBIC插槽,并将其指定为Trunk,故障均没有解决。
  故障解决
携带GBIC模块到故障交换机处。先登录到故障交换机(Cisco Catalyst 3500),使用“no shutdown”命令启用该故障GBIC端口(Gi0/1),端口协议始终处于“down”状态无法被激活。更换GBIC模块之后,该端口LED指示灯仍然不亮,无法被激活。最后,将该GBIC模块拔出,插入另外一个GBIC插槽,LED指示灯立即被点亮。替换为原来的GBIC模块,LED指示灯仍旧为绿色,遂判断该GBIC插槽损坏。最后,登录到该交换机,将Gi0/2端口设置为Trunk,网络通讯恢复。
  故障点评
从实际使用经验来看,Cisco正品GBIC模块正常使用期限为4年左右。从第3年开始陆续出问题(正好是传统保修期刚过的时候),到4年后发生故障的概率达到20%左右。同时,除GBIC模块发生故障外,GBIC插槽的故障也在第3年左右开始出现。
2. GBIC模块损坏

  故障现象
局域网采用简约的二层拓朴结构,核心交换机采用Cisco Catalyst 4006,接入交换机采用Cisco Catalyst 3550。自投入使用近3年来,运行一直正常。今年夏天某日下午上班后,行政楼3楼的计算机用户纷纷打电话到网络中心,表示自己的计算机无法连接到网络服务器,并且无法实现Internet连接。
  故障分析
试着Telnet远程登录该交换机失败。登录至核心交换机,查看连接至故障交换机的端口,发现端口处于“up”状态。携带笔记本电脑到故障交换机处,通过Console端口以超级终端方式登录,查看连接至核心交换机的GBIC端口,发现虽然端口处于“up”状态,但是,输入和输出的量却没有任何变化,如图3所示。
3 端口处于“up ”状态
GBIC模块从交换机上拔下,放在风扇下吹了一会儿,再插回GBIC插槽,网络恢复正常。但是,5分钟左右网络连接再次中断。
  故障解决
至此,基本可以判断是GBIC模块坏掉了。更换一块新的同型号(1000Base-LX GBIC,网络恢复正常。
  故障点评
由于夏天的室外温度高、湿度大,如果室内再没有安装空调,将导致机柜内的温度达到摄氏500以上,而Cisco Catalyst系列交换机要求工作在恒温、恒湿的工作环境中,交换机周围的温度不得超过<?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />45°C,湿度不得超过85%。交换机长期工作在高温高湿环境中时,非常容易产生故障,特别是GBICSFP光纤模块,更容易因此而损坏。

其实,许多做领导的都算不清帐。 1 1000Base-LX GBIC/SFP 模块的价格相当于 2 台空调的价格,而 GBIC/SFP 模块却最容易因为室温过高而损坏。因此,作为一位负责任的网管,一定要跟主管领导讲清楚保持室内温度和湿度的重要性。
3. SFP模块质量太差
  故障现象
体育系使用Cisco Catalyst 2960作为接入交换机。前一段时间SFP模块坏掉了,更换以后,发现网络传输速率大幅下降,大数据量传输时,所使用的时间较以往更长一些。而且在Ping默认网关时,竟然都有丢包现象。
  故障分析
登录至核心交换机Cisco Catalyst 4506,查看连接体育系交换机的端口GigabitEthernet 3/5,显示有大量的错误包输入(如图4所示)。
4 大量错误包
简单的数据统计如下:
248770 packets input, 22095364 bytes, 0 no buffer
Received 6719 broadcasts, 0 runts, 0 giants, 0 throttles
1327086303 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored
0 input packets with dribble condition detected
683091 packets output, 252826070 bytes, 0 underruns
可见,错误包数量竟然是正常输入和输入包总量的1420倍。而后,又使用Sniffer Pro分析了该网络的流量,没有发现异常。而故障前后的硬件和配置的区别,仅在于更换了SFP模块。显然,SFP模块导致故障的可能性非常大。
  故障解决
更换Cisco原厂的1000Base-LX SFP模块后,网络通讯恢复正常。
  故障点评
尽管Cisco原厂的SFP/GBIC模块很贵,而一些水货或假货的价格很便宜,但是,为了保证网络通讯质量,只能购买真品的SFP/GBIC模块。

判断 1000Base-LX GBIC/SFP 模块是否为 Cisco 原厂产品时,有一个非常简单但又非常实用的方法,把真货和假货放在手里分别掂量一下,真货有一种质量感,即比较重,而假货大都非常轻。另外, GBIC/SFP 模块上不干胶标签的印刷水平,也能从另一个侧面反映模块的真假。
4. 系统提示SFP端口被禁用

  故障现象
某天早晨上班后,打开CNACisoc网络助手)时发现有新的提示信息(如图5所示),表明文科楼(wenke_lou)的“Gi0/1此端口已经被禁用,因为发现链接在UpDown状态之间迅速波动。原因可能是交换机端口上的实际连接器硬件或驱动器或连接设备发生故障。建议,更换物理链接器、或升级交换机端口的驱动程序,或尝试更换线缆,然后再次启用端口”。
5 Gi0/1 端口已经被禁用
  故障分析
从提示信息上看,导致故障的可能性有三种,即:
Ø         连接配线架与SFP模块的跳线发生故障
Ø         SFP模块发生故障
Ø         SFP插槽发生故障。
由于光纤跳线发生故障的可能性不大,因此,可以先从SFP模块和SFP插槽开始判断。
  故障解决
先试着更换SFP模块,故障依旧。然后,再更换SFP插槽,故障解决。
  故障点评
Cisco Network Assistant不仅可以用于监视交换机及其端口的工作状态,还可作为网络故障诊断和排除的辅助工具。

与专业的 CiscoWorks 相比, Cisco Network Assistant 安装简单,对计算机的要求也非常低,而且不必单独安装在一台专用计算机上。同时, CNA 的运行速度非常快,与 CiscoWorks 简直是天壤之别。因此,特别适合在中小型网络中管理 Cisco Catalyst 29xx 动性 /35xx /37xx /500 Express 系列交换机。