1、问题描述
128台一起测试,重启4次左右,会出现1~2台设备的LAN口出来下行丢包(上行打7M,下行打15M),出现下行丢包的设备为随机出现。
2、调试经验
2.1 故障分析
由于A2G是JDM项目,软件是客户做的,硬件是我们做的,只能由我们主导分析,
每次出现问题后,将出问题的设备重新上电后测试都能恢复正常;
每次出现问题后,在串口或者telnet执行复位命令复位后也恢复正常;
每次出现问题后,仅仅将PHY芯片复位后也恢复正常;
后来更换Testcenter,网线和交换机测试,仍然有问题。
通过以上实验,根据以往经验,基本可以排除硬件问题;
按照客户要求,测试了冷启动,热启动,软复位三种状态下PHY Reset信号波形以及打流状态下网口差分信号波形,结果均满足要求,结果见如见图示:
图1,冷启动 图2,热启动
图3,软复位 图4,LAN口信号
后来找到另外一家厂商同款设备(硬件不一样,软件一样)测试相关硬件信号也一样,做开关机测试,也有出现这个问题,至此基本可以排除此问题由硬件造成,客户也把分析中心移到了他们的软件上。
2.2 解决措施
后来客户找到芯片厂商一起分析并最终通过修改软件修改PHY寄存器得以解决问题。
3、经验总结
当JDM项目在客户端出现问题后,尤其是问题不像是硬件引起的时候,我们不能完全听由客户让我们自己去分析,我们需要利用客户资源,分析验证引导客户证明问题不是我们硬件造成的。