网络拓扑
三台mesh组网,主节点pppoe拨号,有6台网络摄像头,7台电视盒子,3台手机连接播放视频
问题描述
设备上电之后,视频播放出现异常,同时发现Mesh设备内存减少,连接到Mesh的设备几乎无法进行正常的网页浏览
问题分析
1.通过串口ping www.baidu.com发现丢包严重,但是直接连接上级的设备没有出现任何异常
2.使用top指令查看,发现CPU负载很高,负责Mesh组网的xxx进程占用CPU过高,平均占用16%
3.分析进程源码发现该进程主要用于Mesh设备组网心跳,主节点发送广播包,子节点接收广播包
4.使用omnipeek抓取空口包,发下如下问题:
至此,问题基本定位到是由于广播风暴引起,从抓取数据包可以看到,广播包来自两个设备,找到对应mac地址的设备,发现是两个异常的AP设备,连接到了Mesh设备,然后转发广播包,引起了广播风暴,从而导致网络卡顿
问题验证
断开异常的AP设备,网络恢复正常
总结
对于网络卡顿问题,首先排除上级网路问题,然后使用omnipeek抓取空口包,或者tcpdump抓取设备接口的数据包,基本可以判断问题。
备注:
目前支持omnipeek的抓包网卡推荐使用RTL8812AU,支持2.4G/5G
抓包驱动:https://download.csdn.net/download/wgl307293845/13107018