一个经典的网络内网故障排障全过程

134 篇文章 2 订阅
60 篇文章 0 订阅

交换机是局域网中一种很重要的网络设备,它的工作状态与客户端系统的上网状态息息相关。

可是,在实际工作过程中,交换机的状态很容易受到外界的干扰,那样一来局域网中就会出现各种各样的网络故障。

为了保证网络运行稳定,我们必须在平时对交换机进行妥善管理、维护,避免交换机发生故障。

本篇文章,转载一位资深老网工的排障经历贴。他以前在对某大楼局域网进行维护时,曾经遇到过物理连接不当,而造成楼层交换机无法ping通的故障现象。这种网络故障的排查曾让他颇费一番周折。

由于该故障相对典型,而且其排查思路可供借鉴,所以特此分享给大家。

故障现场:

我当时所负责的写字大楼包含若干个公司,为了保证每个公司都能独立上网,并且要求它们的上网状态不受其他公司的影响,我选用了路由交换机作为大楼网络的核心交换机。

同时在交换机上对每个单位设置了不同的虚拟工作子网。

由于每家单位分布在不同的楼层,每个楼层分布的公司数量也不完全相同,有的楼层有两、三家单位,有的楼层多达五、六家单位。

不同楼层的单位工作子网全部通过对应楼层的交换机,连接到大楼局域网中,并通过大楼网络中的硬件防火墙访问Internet网络。

为了提高网络管理效率,网络管理员平时都会通过远程连接方式对交换机进行管理、维护。

可是,那天早上一上班,我在扫描诊断局域网核心交换机各个交换端口的工作状态时,发现其中某个交换端口处于down状态。

于是我查看了网络管理档案,找到连接该端口的是五楼某二层交换机。

远程登录该楼层交换机时,发现迟迟无法登录成功,使用 ping 命令测试该交换机的 IP 地址时,返回的结果为“Request time out ”;

就在我纳闷为什么没有人报故障时,电话铃声如期而至,果然来自五楼的用户开始接二连三地报修网络故障了。

根据上述故障现象,我估计可能是楼层交换机的工作状态出现了意外。

于是跑到该故障交换机现场,切断该设备的电源,过一段时间后再次接通电源,进行重新启动。

等到启动操作完毕后,我又使用了 ping 命令测试该交换机的 IP 地址。

此时返回的结果已经正常,而且远程登录操作也能够很顺利地进行。

然而,半个小时之后,该故障交换机又出现了相同的故障现象,并且进行 ping 命令测试时,又返回了不正常的测试结果。

后来我不放心,又重新经过反复启动测试,发现故障交换机始终无法正常 ping 通。

深入排查:

既然经过反复重启不能解决问题,我估计引起该故障的原因比较复杂,考虑到这种故障现象在网络管理过程中经常会碰到。

于是我按照下面的思路进行了深入排查:

考虑到整个大楼网络中,只有五楼的某个楼层交换机出现这种现象,所以,我初步判断可能是该楼层交换机自身问题引起的。

为了能够确保可以准确定位故障原因,我准备**利用一台工作状态正常的交换机来替换故障交换机,**看看故障现象是否仍然存在。

同时,将那台被怀疑可能存在问题的交换机连接到一个独立的网络工作环境。

")、

经过半个小时的测试、观察,我看到那台被连接到独立网络环境的故障交换机工作状态是正常的,而且在该网络环境下可以ping通它的IP地址。

而那台新替换的交换机连接到大楼网络后,却不能正常 ping通了。

依照这些现象,我认为五楼的交换机自身出现问题的可能性几乎没有。在排除了故障交换机自身状态因素后,我对整个大楼网络的组网结构和网络状态重新进行了回顾。

由于大楼中其他楼层的用户都能正常上网,唯独五楼的一部分用户不能上网。

查阅五楼的组网资料,我看到五楼分布了五家单位,当时网络管理员在五楼布置了两台楼层交换机,将它们通过级联方式连接在一起;

同时在这两台交换机中划分了五个虚拟工作子网,保证了每家单位都能独立地工作于自己的虚拟工作子网中。

既然核心交换机上的对应端口已经被down掉,那么整个五楼的所有单位都不能上网才对,为什么现在只有一部分用户上报故障现象呢?

等到上班时间一到,我立即电话联系了其他几家没有报修网络故障的公司。得到的答复是说:他们刚刚才发现网络访问不正常,正准备向大楼网络管理员求救。

如此说来,整个五楼的所有单位都是不能正常上网的,那么引起该故障的原因应该在这几家单位的虚拟工作子网中。

在将故障排查范围锁定在位于五楼的五家单位之后,我认为既然重新启动五楼某个交换机的设备,能够暂时地将网络故障恢复。

只是在半个小时之后,相同的网络故障现象才会再次现象。

对照这种特殊的现象,我怀疑可能是网络广播风暴,造成了交换机在一定时间内发生了堵塞现象,最终堵死了核心交换机的对应交换端口。

为了便于分析故障,我利用网络监听工具对五楼交换机的级联端口进行了网络传输数据包分析。

结果发现无论是输入数据包流量,还是输出数据包流量,都非常地大,几乎超过了正常数值的100倍左右,这说明四楼的网络中出现了网络堵塞现象。

")

那么究竟是网络病毒引起的网络堵塞?

还是网络环路引起的网络堵塞呢?

我打算观察一下故障交换机级联端口的状态信息变化,特别是输出广播包的变化。如果输出广播包每秒钟都在不停增大的话,那十有八九就能证明五楼网络中存在网络环路现象。

基于这样的分析思路,我使用 Console控制线直接连接到故障交换机上,以系统管理员身份登录进入该系统后台。

同时使用 display 命令查看了该交换机级联端口的输出广播包的变化,并且每隔一秒钟查看一次,之后比较每次查看的结果。

经过反复测试,我发现故障交换机的输出广播包大小果然在不断地增大。

这说明五楼的五家单位中,肯定存在网络环路现象。

仔细查看了五楼的两台交换机,我发现它们之间的物理连接是正常的。

此外,这两台交换机的各个交换端口直接与五楼各个房间的墙上上网插口相连。

按理来说,只要各个房间不随意使用交换机进行级联, 应该不会出现网络环路现象的。

现在,既然证明五楼网络中存在网络环路现象,这说明肯定有人在随意使用交换机进行扩展上网,我们只要找到扩展交换机,并对它的物理连接进行检查,就能迅速找到具体的故障节点了。

于是我电话联系了五楼各家单位的网络管理员,要求他们对各个办公房间进行检查,并上报使用下级交换机的房间。

没有多长时间,检查结果就反馈给了我**,竟然有10个左右的房间使用了下级交换机进行扩展上网。**

这时我知道这10个房间的网络连接,最有可能出现网络环路现象,那究竟是哪一个房间呢?

难道我要依次到各个房间的现场,查看他们的网络连接吗?

经过认真考虑,我找来了组网资料,将这10个房间使用的交换端口号码一一找了出来。

")

之后使用网络线缆直接插入到这些交换端口中,并在这些端口的视图模式状态下,依次ping故障交换机的IP地址。

结果ping到第六个交换端口时,我发现从该端口无法正常ping通。

为了判断该交换端口是否真的存在问题,我又在该交换端口视图模式状态下,使用 display 命令查看了该交换端口的状态信息。

经过查看分析,我发现该交换端口的输入、输出数据包大小明显不正常。于是,我估计该交换端口肯定是造成故障交换机工作状态不正常的原因。

查阅档案资料后,我迅速根据那个交换端口号码,找到了对应的那个上网房间。

到了现场后,我发现该房间中仅有的两个上网端口,都连接了小集线器,而这两台集线器下面都连接有几台计算机。

更要命的是还有一条网络线将它们直接连接在了一起,这样一来这两个集线器之间就形成了一个网络环路。

该环路造成的广播风暴最终堵塞了故障交换机的级联端口,从而造成了整个楼网络都不能正常上网。

故障解决:

将该多余的网络线缆拔除之后,我重新查看了该交换端口的状态信息。结果发现输入、输出数据包大小都恢复了正常。

再次查看核心交换机上对应的交换端口状态时,发现原因的“down”状态已经变成了“up”状态,而且此时我也能正常ping通四楼的故障交换机了。

这说明,问题果然是由五楼某个房间的用户非法扩展使用交换机或集线器引起的。后来,我经过进一步询问上网用户了解到,他们的房间在前天晚上进行了打扫除,当时所有的网络线全部被拔了下来。

当清洁工作结束之后,上网用户由于对连接知识了解不多,就随意进行了插接,最终造成了网络环路现象,,所以这点我们网络工程师平时在做维护项目时,也需要注意。

END

`黑客&网络安全如何学习

今天只要你给我的文章点赞,我私藏的网安学习资料一样免费共享给你们,来看看有哪些东西。

1.学习路线图

攻击和防守要学的东西也不少,具体要学的东西我都写在了上面的路线图,如果你能学完它们,你去就业和接私活完全没有问题。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己录的网安视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

内容涵盖了网络安全法学习、网络安全运营等保测评、渗透测试基础、漏洞详解、计算机基础知识等,都是网络安全入门必知必会的学习内容。

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

CSDN大礼包:《黑客&网络安全入门&进阶学习资源包》免费分享

3.技术文档和电子书

技术文档也是我自己整理的,包括我参加大型网安行动、CTF和挖SRC漏洞的经验和技术要点,电子书也有200多本,由于内容的敏感性,我就不一一展示了。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

CSDN大礼包:《黑客&网络安全入门&进阶学习资源包》免费分享

4.工具包、面试题和源码

“工欲善其事必先利其器”我为大家总结出了最受欢迎的几十款款黑客工具。涉及范围主要集中在 信息收集、Android黑客工具、自动化工具、网络钓鱼等,感兴趣的同学不容错过。

还有我视频里讲的案例源码和对应的工具包,需要的话也可以拿走。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

CSDN大礼包:《黑客&网络安全入门&进阶学习资源包》免费分享

最后就是我这几年整理的网安方面的面试题,如果你是要找网安方面的工作,它们绝对能帮你大忙。

这些题目都是大家在面试深信服、奇安信、腾讯或者其它大厂面试时经常遇到的,如果大家有好的题目或者好的见解欢迎分享。

参考解析:深信服官网、奇安信官网、Freebuf、csdn等

内容特点:条理清晰,含图像化表示更加易懂。

内容概要:包括 内网、操作系统、协议、渗透测试、安服、漏洞、注入、XSS、CSRF、SSRF、文件上传、文件下载、文件包含、XXE、逻辑漏洞、工具、SQLmap、NMAP、BP、MSF…

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

CSDN大礼包:《黑客&网络安全入门&进阶学习资源包》免费分享

  • 19
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1、所有设备初始化 修改设备名称(根据拓扑标注),关闭DNS解析功能,特权加密密码为ciscocisco,在CON口设置空闲超时为2分钟10秒, 在VTY口设置空闲超时为永不超时,在这两个线路平台使用光标跟踪,密码为cisco。所有的明文需要进行再加密。 2、公司有2个部门和1个服务器区分别在不用的房间: ROOM-1:VLAN 22 ROOM-2:VLAN 33 ADMIN:VLAN 11 3、公司内部为了管理维护方便,在内部架设了1台DHCP服务器,并且在分支机构R3上也启用了DHCP服务,并且要求整网采用DHCP分配地址。 VLAN33用户对于通过DHCP服务器的要求:分配地址去掉前10个地址,从第11个地址开始分配,地址段只能分配20个地址,地址池的名称根据VLAN来命名,DNS为192.168.0.100; VLAN 22用户对于R3本地启用的DHCP要求:排除掉分配给用户网段的一些固化地址,并且用户从第5个地址开始分配,DNS为192.168.0.100,地址池的名称根据VLAN来命名。 4、由于公司的业务发展在各个地区都有了分支机构,公司为了节约成本达到互联的目的,采用帧中继的方式。帧中继采用的是星型拓扑形式,以R1为中心分别与R2、R3互联,并且用的静态映射。分支机构之间使用RIPv2,实现总部内部与分支内部互访的功能。 帧中继的映射:S0:R1—R2 R1—R3,S1:R2—R1,S2:R3—R1 5、公司内部分了很多部门,为了数据的安全有的部门不希望别的部门访问。 用户要求ROOM-1不允许ROOM-2访问,其他能够正常转发数据。访问列表用扩展的命名形式,列表的名称为ACL。为了网络设备的管理安全要求只有ADMIN网段可以去telnet远程管理R1,访问列表用标准的命名方式,列表名称为ACCESS。 6、公司对外还有一根专线用来访问互联网,为了安全起见,与ISP的串行连接用PAP验证,密码为123class。 7、运营商给了公司7个地址:60.29.10.3-10,地址池名称为network,访问列表为55(允许所有内网可以访问外网除了分支机构外)。用PAT实现内网到外网的转换互访。边界路由器R1做一条静态路由(下一跳地址)指向ISP的WEB服务器区网段,ISP用默认(送出接口)指向公司。 8、测试连通性。
EPON_EoC EoC EoC双向网改造导致电视播放异常故障排查.pdf EoC头端无法管理故障排查.pdf EoC终端注册不上故障排查.pdf EoC终端配置下发不生效故障排查.pdf EoC网络PPPoE拨号上网故障排查.pdf EPON EPON网络监控业务不通问题排查.pdf OLT上无法ping通ONU的管理地址故障排.pdf ONU注册类故障排查.pdf ONU长发光故障排查.pdf SMB V5交换机POE问题排查.pdf 网络监控业务不通故障排查.pdf 网络监控业务不通问题排查.pdf iMC管理软件 EAD_iNode APM应用监控故障排查.pdf DAM软件分发故障排查.pdf EAD可控软件管理故障排查.pdf EAD补丁管理故障排查.pdf EAD防病毒软件故障排查.pdf iMC BIMS组件问题分析.pdf iMC双机冷备方案故障排查.pdf WSM资源管理故障排查.pdf 桌面资产管理故障排查.pdf PLAT iMC APM 数据库管理故障排查.pdf iMC Dbman备份故障排查.pdf iMC license故障排查.pdf iMC告警管理故障排查.pdf iMC安装部署故障排查.pdf iMC性能管理故障排查.pdf iMC拓扑管理故障排查.pdf iMC数据库故障排查.pdf iMC设备管理故障排查.pdf iMC页面响应慢故障排查.pdf iMC页面显示乱码故障排查.pdf iNode安装运行故障排查.pdf Portal无感知认证排错.pdf Portal认证页面无法弹出故障排查.pdf WSM射频管理故障排查.pdf WSM无法识别或同步AC故障排查.pdf 备份设备配置文件失败故障排.pdf 拓扑常见问题排查.pdf 访客二维码认证故障排查.pdf 访客基本功能排错.pdf 防内网外连.pdf 防破解故障排查.pdf UAM_iNode 802.1x认证故障排查.pdf EIA之BYOD特性故障排查.pdf LDAP用户管理故障排查.pdf UAM Portal认证故障排查.pdf 证书认证故障排查.pdf UBA_NTA iMC NTAUBA管理NetStream日志故障排查.pdf iMC UBA管理NAT及FLOW日志故障排查.pdf 云计算产品 CAS CAS日志下载失败问题排查.pdf cloudos创建云主机失败排查.pdf CVK主机存储池暂停失败问题排查.pdf DRX业务扩展异常排查.pdf H3C CAS主机性能缓慢问题排查.pdf H3C CAS云计算平台License使用.pdf H3C CAS云计算平台虚拟机优化.pdf H3C CAS虚拟机暂停问题排查.pdf H3Cloud OS云操作系统新建虚机异常问题排查.pdf 主机Overlay方案新建虚机转发不通故障排查.pdf 云学堂学生机无法连接云课堂问题排查.pdf 虚拟机启动异常故障排查.pdf 虚拟机手动迁移失败故障排查流程.pdf 虚拟机状态不一致排查.pdf 零存储集群添加节点异常问题排查.pdf 机架服务器 FlexServer R390服务器指示灯告警故障排查.pdf 刀片服务器开机故障排查.pdf 交换技术 AAA Radius故障排查.pdf TACACS故障排查.pdf QoS QoS故障排查.pdf 以太网二层技术 BPDU Tunnel故障排查.pdf QinQ故障排查.pdf Voice Vlan故障排查.pdf 以太口故障排查.pdf 以太网链路聚合故障排查.pdf 可靠性 RRPP故障排查.pdf TRACK故障排查.pdf VRRP故障排查.pdf 堆叠技术 IRF II故障排查.pdf 安全接入 802.1x与EAD故障排查.pdf

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值