网络故障排查流程及工具使用手册
2020.04
1.网络故障排查步骤流程:
2.一般的网络故障排查步骤如下:
2.1描述故障现象
亲临现场观察用户演示故障,向用户询问故障发生前的操作行为, 故障发生的首次时间、频率、影响的范围以及故障发生前是否对该节点或网络进行改动, 整理并记录故障现象.
2.2收集可能产生故障原因的信息.
查看网络维护日志并向其他网管员了解近期故障区域的相关变动信息.通过网络管理系统、网络设备诊断命令、操作系统诊断命令、协议分析工具以及网络测试仪器收集故障相关信息.比如, 观察双绞线与水晶头的连接是否正确;通过show interface命令查看交换机端口的状态是否异常;
2.3析故障的原因.
收集到的信息, 分析列举出导致故障的各种可能原因.
2.4解决方案
针对故障原因,按优先级排序,从可能性由大到小的制定出解决方案,提高排查的效率.
2.5逐一实施解决方案
逐一实施解决方案的对策,并观察网络状态,直到故障恢复正常.在实际综合布线故障排除时,可以先采用分段法确定故障点,再灵活应用结合替换法等排除故障,从而提高故障排查的效率.
2.6记录录好故障排查过程
故障排查的过程要认真记录每更改一个参数的结果.处理完故障后,要搞清楚故障发生的原因,定相应的对策,尽可能避免类似的故障再发生,同时记录好日志已备日后查阅,积累运维经验.
3.硬件故障排除工具:
3.1 测线寻线仪
校园网运维中最常用的是测线寻线仪,支持定位、分离、导通、查找RJ45网络线(UTP、STP、Cat 5e、Cat 6、Cat 7)、RJ11/12电话线(Cat 3),且能使用户确认并诊断电缆,布线的通路、短路、断路、交叉等现象,寻线长度达3公里,音频网络测试器可以轻松寻线,可直接与具有活电的电信设备和路由器连接。线序/故障测试距离达300米,有快速/慢速扫描功能可供选择
3.2 光功率器
用于测量绝对光功率或通过一段光纤的光功率相对损耗的仪器.用光功率计与稳定光源组合使 用,则能够测量连接损耗、检验连续性,并帮助评估光纤链路传输质量.
3.3 无线网测试软件
CloudCampusAPP、WIFI魔盒等,能快速执行无线网络发现工作,全面评估当前无线网络的安全性和可用性设置,测试结果包括网络可用性、连接情况、干扰检测等.
4.网络诊断命令:
以网络设备厂商提供了功能丰富的诊断命令,可以用来进行故障查找与排除,问题 诊断以及性能检测.常用的命令有:
4.1思科:
Show——查看系统状态和系统信息.
Debug——获得路由器中交换的报文和帧的细节信息,用于调试信息.
Ping——检查网络是否能够连通以及正常通信.
Traceroute——跟踪路由,提供路径信息,确认链路延迟情况.
4.2华为:
查看设备信息 display device
查看接口display interface
查看版本信息display version
查看当前配置 display current-configuration
查看告警信息 display trapbuffer
查看系统日志 display logbuffer
查看内存使用信息 display memory-usage
查看cpu使用情况 display cpu-usage
查看接口开启情况 display interface brief