前言
cpu使用率100%
问题,是一个让人非常头疼的问题。因为出现这类问题的原因千奇百怪,最关键的是它不是必现的,有可能是系统运行了一段时间之后,在突然的某个时间点出现问题。
今天特地把我和同事,之前遇到过的cpu使用率100%的问题,总结了一下,给有需要的朋友一个参数。
1 一次性获取的数据太多
我之前参与过餐饮相关的业务系统开发,当时我所在的团队是菜品的下游业务。
当时菜品系统有菜品的更新,会发kafka
消息,我们系统订阅该topic
,就能获取到最近更新的菜品数据。
同步菜品数据的功能,上线了一年多的时候,没有出现过什么问题。
但在某一天下午,我们收到了大量CPU100%的报警邮件。
追查原因之后发现,菜品系统出现了bug,我们每次获取到的都是全量的菜品数据,并非增量的数据。
一次性获取的数据太多。
菜品修改还是比较频繁的,也就是说我们系统,会频