生产环境中,一台小机,操作系统为AIX,运行的为Oracle数据库,在一天早上,收到短信告警,ping不通了,可奇怪的是,过一会儿,又自动恢复了。
生产系统数据库服务器ping不通,会是什么后果,可想而知,还好,此次ping不通的是public ip,ORACLE数据库的vip ip、priv ip都正常,不然,数据库就会被搞宕罗。
运维无小事,既然告警都出来了,是什么原因导致的ping不通,得搞清楚啊,领导步步进逼,原因是什么?原因是什么?
1、 万事先看日志
AIX,先敲个errpt命令看看
简直是太容易找出原因了,在短信告警的时间内,操作系统上也在这相近时间,报出了“DUPLICATE IP ADDRESS DETECTED IN THE NET”信息。
报错内容是IP冲突啊。
2、如果是你的个人电脑遇到IP冲突,你怎么办呢?
这时可以想想,自己的个人电脑可能也遭遇过IP地址冲突的经历吧,当你遭遇IP冲突时,想过该怎么来查到底是谁冲了你的IP吗?有几次IP冲突有查出来到底是谁干了什么或是具体是哪里出问题导致的IP冲突呢?
3、我是生产环境,查出具体原因没商量
“是什么原因导致的生产环境服务器IP冲突呢?”,就领导这么一句打破沙锅问到底的话,如果我不给出明确的答案,那还能在这里混得下去么。
3.1 先查到与我生产服务器IP冲突的设备MAC地址
下面输出AIX操作系统错误的详细信息,从这里面来找找夺我IP地址的设备MAC地址。
# errpt -aj FE2DEE00|more
|