两个机器ping不通怎么考量 ?
- ping基于icmp协议,有可能是禁止icmp ping或者防火墙拦截、安全组、selinx等
- 通过网络抓包tcpdump 分析网络流量,结合wireshark定位具体的问题,结合网络命令分析跟踪路由分析 traceroute mtr 等
如果无法reach 一个指定机器怎么办?
- 确认机器无法reach后,确认机器管理权限在哪里?
- 云上: 检查服务器运行状态,主机宕机关机、主机运行但是无法连接,可以通过vnc连接到具体服务器检查,或者连接云服务厂商工单支持等
- 机房: 找机房it团队配合协助解决
用户的服务部署在一个remote host上,down了后你要怎么debug?
- 服务器是否具备远程管理?可管理结合一下分析定位
- 收集信息-发现问题: 服务日志、系统日志、内核日志
- 定位问题: 检查日志是否有异,分析系统内核是否有资源瓶颈,是否由于系统资源不足如触发oom等
- 解决问题: 资源瓶颈 服务扩容增加节点负载均衡 系统优化等