Vitesse现场问题定位过程
- 现象:用如下命令查看经常会看到有时会cpu的占用率过高的问题:
show system cpu status
导致网络不稳定,时长震荡,生成树协议频繁倒换。
- 使用如下的命令查看单个进程的cpu占用率
platform debug allow
debug thread load-monitor //开启单个线程cpu查看的功能
debut thread status //查看每个线程的cpu 利用率
- 发现是中断进程占用的cpu利用率比较高,单独用中断的调试命令查看中断的信息
debug interrupt-monitor source 0 //来查看各个向量所报的中断信息
vtss_appl\board\interrupt_api.h //所有中断源的编号,都可以在这个文件中查到。
- 最终查看到某个光口的los信号一直频繁的上报,按道理来说los信号只在插拔光纤的是偶才报,不应该频繁的报,可以定位为该端口的硬件有问题。最后定位问题在是两块逻辑芯片分布在两块板子上,导致sgpio信号失真。