排错精髓
- 确定拓扑
- 根据拓扑确定功能
- 确定思路(自上而下、自下而上)
- 展开分析
定界——定位——定因
故障处理思路客户端通过DHCP获取不到地址
客户端无法获取完整的IP地址(思考顺序)
- pc终端或者操作系统问题
- 环境问题(环路或者攻击)
- 配置错误或者不合理
- DHCP server服务器性能不足
排查思路
1、排查客户端以及操作系统问题
- 确认故障是单台客户端还是大面积客户端都无法获取地址
- span功能
- 配置镜像源或者是端口vlan
若只有一台pc出现问题,可以在pc端安装抓包软件,通过查看客户端是否正常发出DHCP Discover来判断——重装网卡、重装系统
2、配查网络环境问题
- 尝试将pc设置为静态的ip和网关,查看是否可以通信,排除客户端与服务器之间物理连通性——查看连通性、时延、抖动
- 查看是否有环路或者是攻击现象(不能ping通或者掩饰很大)——消耗cpu和带宽资源,导致时延和抖动
- 沿途查看是否有交换机cpu过高的情况,尤其是DHCP server是否存在cpu过高情况
- 线路有问题的可以从客户端到DHCP服务器进行逐点抓包,确定丢包或者时延原因
- 排查中间设备或者链路上加密机是否进行了过滤端口——因为DHCP是基于传输层的UDP,所以ACL过滤之后包就会丢失,对方就无法收到
- 最简化功能,比如acl、pvlan、vlan应用,mstp中的block端口,排查是否有攻击现象①私设DHCP服务器欺骗攻击②DHCP服务器攻击——配置冲突、软件bug
3、配查网络配置是否正确
- DHCP relay 一般配在三层网关设备上
- DHCP snooping 配置信任口和非信任口,去往服务器口为非信任口(防止私设DHCP服务器)
非信任口拒绝DHCP报文通过,需要手动配置信任口
4、配查DHCP服务器性能
- 查看地址池有没有可用IP
- show IP dhcp server增加地址池可用范围
5、排查设备软件版本问题
6、收集信息联系技术支持
- show dhcp lease
- show ip dhcp
L2和L3常用技术
- L2:stp、trunk、arp、vlan
- L3:vrrp、ospf、acl