记录一次IP冲突引起的惨重教训

  昨天,XX部门的某经理要求我搭建个共享服务器,为此,我部署了一个简单的SAMBA服务器以供他们使用。

    首先,像往常一样,找了一部普通的商用台式机装好了Centos6.3,然后开始在此网段内找了一部电脑,开始ping IP,ping了10.xx.xx.xx后,发现ping不通,再使用nmap查一下,也没查到有此主机存在,断定此IP没人用(因为10网段的没用于生产,防火墙规则应该没那么严格),于是我开始使用该IP。设置好系统网络参数后,开启ssh服务后,我就离开此服务器,回到我位置上,开始用ssh登录,数分钟后,发现断开连接了,顿时觉得很奇怪,又跑到该机器那里,发现机器没有down, 网络却down了,隔了一段时间,又up了,真是奇了怪了。

     每当重启network的时候,我就开始ping网关,一般前面30个request是得不到响应的,到30多个后,就开始收到网关的响应,然后隔了10几秒后,发现日志显示eth0 link down。

     一直想不到什么问题,于是我弄了一条交叉线,接在此服务器与另一台服务器上,开始互ping,奇怪的是居然ping不同,一开始以为交叉线有问题,可是当其他机器互ping的时候却可以ping通。

     这就样搞了很久,很没想到问题的原因,由于这个IP已经叫网络管理人员帮我放行了防火墙,所以一直不希望改IP,因为改IP的话,又要麻烦网管了,但是实在是没办法了。迫不得已改一下IP试一下,结果发现,重启network,虽然ping网关的时候,虽然前面10几个request显示到达不了主机,但是10几个报文后,开始ping通,并且一直没断过。

    就这样,我让它ping了一晚。

    第二天,发现,没有报文loss。开始断定之前的IP有问题。重新改回之前的IP的时候,问题又再次出现。事不宜迟,加上别人催了,赶紧换个IP,重新放行防火墙。

    弄好后,跟经理汇报可能之前的IP有人用,经理使用nmap查了一下,发现真的有一部机在使用此IP。问题终于发现了。原来这部机是比较特殊的,是唯一一部在这个网段的生产平台上的机器,做了防护措施,所以我ping不通。听那个管理那个机器的同事说:昨天网络一直断断续续,好奇怪,才知道原来搞乌龙了,真是费力又费神!!

    之后,赶紧规划好每个人使用IP的范围,避免再次出现此类事件。