今天实验室的网络又出现了故障,同学们都上不去外网,这里描述一下现象:本机ping网关不同。然后去机房进行调试,首先是通过机房机器ping路由器:不通,说明问题出现在本地路由器和交换机的身上,然后机房机器互相ping:通,说明问题不是交换机,那么问题估计就是出现在路由器的上面。于是找来串行线,连接到一天linux机器上面进行调试。过程如下:
1.set line /dev/ttyS0
2.set speed 9600
3.set arrier-watch off
4.minicom -s
5.选择serial and port
6.A://dev/ttyS0
E:9600 8NY1
G:ON
F:YES
7. Save as .....:switch01
8.EXIT
如果顺利的话今日路由器登录界面,输入用户名和密码
ping 路由器网关
不通
ping 机房服务器
不通
然后我怀疑还是交换机的问题,可是机房机器互相ping是通的。更换交换机,路由器ping通外网。仔细观察,发现一条机器的灯不停的急闪,初步怀疑是那台机器的事情,重启机器后,网络正常。
(补充:本机房是单臂路由,外网---交换机---路由器)
对于今天的现象,我初步总结处理机房事故的一般步骤:
1.ping 网关,如果通了而外网不通,说明事故一般出在外面机器上面;
2.telnet 网关,ping 路由器的网关,如果不通,一般是出事在外面的路由器上。
3.如果ping不通网关,则第一检测网络包,是否存在网络攻击现象,如果没有则进一步检测网络硬件
4.重启交换机和路由器,如果重启后依旧无法排除故障,则对路由器和交换机分别进行测试
5.机器互相ping,确保交换机没有问题;然后通过路由器ping内网和外网,如果内塞外通,则故障或是出在网线或者路由器自身;
6.更换一个设备,对交换机和路由器分别隔离测试;
机房网络故障,一般情况下面无非是网络攻击遭致网络拥塞,硬件故障的情况不会太多(对于实验室这样的小机房),重要的进行排查,分析。今天我的排查逻辑就出现了一点混乱导致浪费了很多事情。
正确的逻辑换来更多的事情去思考!