一、问题现象
网络拓扑
服务器01的网络一直正常。
服务器02的网络时通时断,通1min断1min,大概是这样的规律。
二、问题解决思路
1、首先判断是交换机的问题还是服务器的问题。
2、按照正常逻辑判断,服务器01一直正常,那么大概率是服务器02本身的问题。
3、猜测在咱们技术人员手里,不能作为判断问题的根本,只能作为排查问题的指引思路。
4、上手段。
三、如何解决问题
1、抓包。在服务器02中断的时候,执行tcpdump -i any host 192.168.0.254,发现只有request包,没有reply包。
2、确定为服务器02本身的问题。
3、在服务器02上执行以下命令
#查看NetworkManager服务工作状态
systemctl status NetworkManager
#查看network服务工作状态
systemctl status network
# 停止NetworkManager服务
systemctl stop NetworkManager
#将NetworkManager服务的开机自启关闭
systemctl disable NetworkManager
#启动network服务
systemctl start network
通过以上的操作问题成功解决。
四、思考
IT的世界问题复杂多样,解决问题按照排查日志、抓包等各种方式一一排查,最终就能找到问题原因。