k8s liveness与突发流量导致的雪崩

最新推荐文章于 2022-09-21 16:57:47 发布

皿小草

最新推荐文章于 2022-09-21 16:57:47 发布

阅读量613

点赞数

分类专栏： k8s 文章标签： kubernetes 服务器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oqqYuan1234567890/article/details/122205764

版权

k8s 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

前阵子新上线的一个服务，是一个 NodeJS HTTP API 应用，是一个 CPU 密集型应用，一旦请求量过高，就无法接受新的连接。

与此同时，pod 配置了 liveness probe，每隔15s 会调用一次 localhost 的心跳 API, 心跳 API 与业务都在一个端口。应用有配置 HPA。线上跑了一阵，没有发现什么问题，会正常扩容。

此时，问题就来了，由于有一阵较大的突发流量，直接把所有 pod CPU 打满，打满的时候，由于 liveness probe 失败，导致部分 pod 被频繁重启。频繁重启又导致处理能力不够，其它 pod 的负载更高，于是其它 pod 又被重启。于是，一次教科书般的雪崩发生了。如果不是突发流量，也许 HPA 扩容后可以解决这个问题

回顾

NodeJS http server 的特性，CPU 过高会影响连接的接入能力，这个问题暂时无解
liveness 的设置，如果面临上一种情况，则要考虑关闭 liveness probe 或者延长到一个较大的值，等到 HPA 把 pod 拉起来后，基本可以解决问题。（当然 HPA 的最大实例需要满足流量高峰）

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
k8s liveness与突发流量导致的雪崩

前阵子新上线的一个服务，是一个 NodeJS HTTP API 应用，是一个 CPU 密集型应用，一旦请求量过高，就无法接受新的连接。与此同时，pod 配置了 liveness probe，每隔15s 会调用一次 localhost 的心跳 API, 心跳 API 与业务都在一个端口。应用有配置 HPA。线上跑了一阵，没有发现什么问题，会正常扩容。此时，问题就来了，由于有一阵较大的突发流量，直接把所有 pod CPU 打满，打满的时候，由于 liveness probe 失败，导致部分 pod 被频
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。