Linux故障分析

一次IP冲突的Linux故障分析 下面通过一个案例介绍下当一个服务器IP被误用后的处理思路和处理过程,网关服务器双向绑定MAC是Linux系统下最常见的防ARP欺骗和盗用防御手段和措施。

1、故障现象 在我司中山火炬机房托管的IDC客户,报障大面积的网络丢包,以下是监控数据截图 输入图片说明输入图片说明 2、初步分析 从图表可以看出,客户的监控工具为Zabbix,搭建zabbix默认icmp检测频率为1s,即每秒发一次ping包检测被监控的服务器网络质量情况,批量的托管服务器丢包,客户第一时间反馈我司,是最高效的方法,而故障分析需要客观,对此我司作出以下几点分析与引导: Ⅰ、明确故障线路:zabbix为一台监控机,确定监控机是什么线路(电信、联通、移动、或睿江内网线路)至我司BGPip Ⅱ、我司检查对应线路出口是否拥塞,内网、公网测试客户故障IP Ⅲ、客户端提供双向MTR截图(源IP和目的IP地址相互访问)(Linux系统MTR工具) Ⅳ、客户检查监控机CPU、内存等负载是否超负荷

3、数据交互分析(故障点) 输入图片说明 Ⅰ、监控机为BGP线路,监控机到监控服务器网络为睿江内网;根据监控数据截图,同时多台不同段不同上联服务器异常可能性较小(故障点④),并结合图2至网关48.129丢包率达42.7%且连续至内网网络和图2_1睿江内网正常的情况(故障点②),可初步定为至监控机异常(故障点③); Ⅱ、我司检查对应线路出口并没有拥塞,而测试图3可以侧面反映外省节点到睿江出口正常(故障点①), Ⅲ、客户端提供测试图如下 输入图片说明输入图片说明 本地软件中断未决 其中,em1公网网卡down和内核告警本地软件中断未决,在内核软件中断告警前提下,出现硬件网卡中断,那么很有可能是网络层面故障,我们先从硬件层面排除加以验证: IDC机房更换全新测试正常网线观察,依然存在网卡中断情况。

导致网卡中断,IP不可用被占用的情况,我们尝试排查IP冲突或ARP欺骗,使用Linux命令: ![输入图片说明]

由睿江云客响人员提供,想了解更多,请登陆www.eflycloud.com

转载于:https://my.oschina.net/u/3363053/blog/909717

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值