运维人最怕网络出故障。先抛开一些闲话不谈,网络故障从大体上来讲,有下面几种情况:
// 硬件问题 //
既然网络设备是一台机器,就有可能出现“疲劳”,从而导致各种各样的硬件故障出现。硬件的故障,一般有下面几种情况。
第一种是造成整机停机的故障。
停机属于重大安全问题,造成停机的原因一般有以下几点:
(1)设备电源模块损坏,常见于一些单电源的盒式交换机;(2)设备在搬移过程中,因为碰撞,摔打造成的主板芯片受损;(3)一些使用超年限的设备,在重启的时候出现问题,起不来了;(4)因为机房环境不好,设备温度过高造成“假死”的现象。
设备停机属于重大安全问题,也是特别紧急的事件,需要马上更换设备。即使是假死,都要把备机准备好了再操作,防止假死的设备重启时真的挂了。