![b3cbfdb868454771e33fbaa71fb55368.png](https://i-blog.csdnimg.cn/blog_migrate/24b67de696815dd64641d0f3d94bc9f4.jpeg)
背景
1. oap服务端首先告警,cpu load飙升至上万(4c8g机器),集群内三台机器陆续崩溃。
![fa0ad16f4170c7c484c200efea33a744.png](https://i-blog.csdnimg.cn/blog_migrate/eae6994d16b415bd0ec1282b5bf8ef7b.jpeg)
2. 重启三台oap后,几分钟内,又都被击垮。
3. oap崩盘后,服务A单台机器,内存使用飙涨(使用率达到93%),线上紧急摘量。
![cd604f275680877c813bf451352eaf17.png](https://i-blog.csdnimg.cn/blog_migrate/88ef9dc5faa30efd3346ab5fb55cd30d.jpeg)
4. 服务B所有机器,也出现内存飙涨,线上立即摘量重启。
1. oap服务端首先告警,cpu load飙升至上万(4c8g机器),集群内三台机器陆续崩溃。
2. 重启三台oap后,几分钟内,又都被击垮。
3. oap崩盘后,服务A单台机器,内存使用飙涨(使用率达到93%),线上紧急摘量。
4. 服务B所有机器,也出现内存飙涨,线上立即摘量重启。