一、Netty channel timeout大量新增问题
场景描述:比如生产有10000台机器,就是偶尔有几百台机器下线,查询程序运行正常、CUP、网络、业务量都正常,机器下线原因是由于Channel TimeOut导致。为什么导致Channel TimeOut?可能原因网络断开、心跳丢包、心跳堵塞。待排查
二、Netty 设备新增上线导致设备离线率大量上升问题
场景描述:比如生产环境有10000台机器,平时每秒离线率在1%,但是有新增1000台机器将要上线,此时机器离线率大量上升比如上升到5%,然后慢慢的机器都上线,然后离线率回归到1%,这个时间大概需要30分钟。