总体思路是:确认丢包的设备—>确认具体原因—>求助华为技术支持工程师。
•步骤一:确认丢包的设备
1.缩小故障范围,定位出可能存在丢包的设备。
在接口视图下执行display interface interface-type interface-number命令查看接口收发报文计数,初步判断本设备有没有丢包。
一般情况下,如果收发正常(即没有持续的Discard,Error计数增加),表示本设备不存在问题。需要沿转发路径,以同样的方法定位下一台设备是否存在问题。
2.在可能存在丢包的设备的入接口和出接口上部署流策略,分别统计入接口的Inbound方向和出接口的outbound方向的特定报文,以进一步确认该类报文是否在本设备被丢弃。
例如:统计从Ethernet0/0/2接口发送的源IP为10.142.132.248目的IP为10.142.132.81的ICMP报文计数。
•步骤二:根据丢包的类型,确认具体的原因。
◾二层报文转发丢包请参见二层报文转发丢包的故障定位思路。
二层报文丢包常见原因主要包括:
- 接口的状态异常(如物理状态Down,工作模式为半双工、和对端自协商不一致)
- 接口被STP、RRPP、Smartlink、LDT等协议阻塞
- 接口没有加入相应的VLAN,导致接口不允许报文通过
- 设备MAC地址学习异常
- MAC地址配置中存在导致丢包的一些配置,例如:
- 关闭了MAC地址学习,并且指定丢弃动作
- 配置MAC地址学习限制规则,对超过MAC地址学习数量限制的报文采取丢弃的动作
- 配置了静态MAC
- 配置黑洞MAC
- 配置了端口安全
- 接口下配置了丢弃没有匹配灵活QinQ和VLAN Mapping的报文
- 接口下配置了丢弃入方向带VLAN Tag的报文
- 接口下未使能BPDU功能,导致无法透传BPDU报文
◾三层报文转发丢包请参见三层报文转发丢包的故障定位思路。
常见原因
- 接口状态异常(如物理状态Down,工作模式为半双工、和对端自协商不一致)
- 接口被STP、RRPP、LDT等协议阻塞
- 路由不通
- 本端没有学习到对端ARP表项
- 接口、VLAN、VLANIF或全局下应用的流策略中包含deny动作
- 接口或VLAN下配置了流量抑制功能
•步骤三:搜集相关信息,求助华为技术支持工程师。