记录一次生产CPU使用率100%问题排查
问题背景四月中旬生产环境的服务器频繁爆出cpu使用率100%的警告,起初这个业务线不是我负责,也就没有深入了解问题。后边,负责这个业务线的同事离职了,这件事就落在我这边了。然后,开始长达两个月的问题排查和解决方案制定的历程,感叹离职的同事错过了这次学习的机会!问题分析在计算机上能引起cpu使用率100%的原因不外乎以下几种:计算密集型业务,需要进行大量计算导致CPU使用率过高死循环,代码级别的bug(这种一般在上生产环境之前就应该排查出来,要么是测试的锅,要么是测试的锅,要么是测试的锅)内存耗




