最近DAP环境的一台portal机频繁被反馈无法正常访问,进页面大多数是404,屡次重启tbds-portal、tbds-server、cas、nginx等服务,稍微一两次恢复正常访问,但是好景不长,很快又恢复原状,无法访问,经过高手排查了一天,终于发现了问题所在。
由于服务是部署在linux服务器172.16.119.151上面的,该服务是对一定网段的用户开放的,所以正常情况下我们通过window的cmd命令窗口去ping这台服务器,和telnet这台服务器相应的服务端口是可以通的,而现在是只能ping通却无法telnet通相应的服务。portal节点的服务端口是80,我们在web界面现在是无法访问的,然而我们在cmd里面却可以telnet到这个端口,这似乎找到了突破口,紧接着,我们iptables -A INPUT -p icmp -j DROP开启了172.16.119.151服务器上面的防火墙,这时在linux服务器里面自己也已经ping不通自己了,但是我们在window的cmd里面仍然能ping通这个IP地址,我们把同样的操作放在了集群的另一台172.16.119.152上面进行尝试,发现是两边都不会通,说明172.16.119.151这个IP不止我们这一台机器在用,别的另一台机器跟我们重名了。