Kubernetes 弹性伸缩全场景解读（二）- HPA 的原理与演进

最新推荐文章于 2024-06-11 16:04:48 发布

阿里云技术

最新推荐文章于 2024-06-11 16:04:48 发布

阅读量1.3k

点赞数

文章标签：监控弹性伸缩 Server 云原生

本文链接：https://blog.csdn.net/weixin_43970890/article/details/97269533

版权

本文深入探讨了 Kubernetes 中的 Horizontal Pod Autoscaler (HPA)。介绍了 HPA 的基本原理，通过计算 Pod 工作负载进行弹性伸缩，并解析了 HPA 的演进过程，从 v1 到 v2beta2，以及监控指标的分类。文章还讨论了 HPA 的关键特性，如噪声处理、冷却周期和边界值计算，并展望了 HPA 的未来发展方向。

摘要由CSDN通过智能技术生成

前言

在上一篇文章 Kubernetes 弹性伸缩全场景解析（一）：概念延伸与组件布局中，我们介绍了在 Kubernetes 在处理弹性伸缩时的设计理念以及相关组件的布局，在今天这篇文章中，会为大家介绍在 Kubernetes 中弹性伸缩最常用的组件 HPA（Horizontal Pod Autoscaler）。HPA 是通过计算 Pod 的实际工作负载进行重新容量规划的组件，在资源池符合满足条件的前提下，HPA 可以很好的实现弹性伸缩的模型。HPA 到目前为止，已经演进了三个大版本，本文将会为大家详细解析 HPA 底层的原理以及在 Kubernetes 中弹性伸缩概念的演变历程。

HPA 基本原理

HPA 是根据实际工作负载水平伸缩容器数目的组件，从中可以提炼出两个非常重要的关键字：负载和数目。我们可以用一个非常简单的数学公式进行归纳：

下面举一个实际例子进行上述公式的阐述。
假设存在一个叫 A 的 Deployment，包含3个 Pod，每个副本的 Request 值是 1 核，当前 3 个 Pod 的 CPU 利用率分别是 60%、70% 与 80%，此时我们设置 HPA 阈值为 50%，最小副本为 3，最大副本为 10。接下来我们将上述的数据带入公式中：

总的 Pod 的利用率是 60%+70%+80% = 210%；
当前的 Target 是 3；
算式的结果是 70%，大于50%阈值，因此当前的 Target 数目过小，需要进行扩容；
重新设置 Target 值为 5，此时算式的结果为 42% 低于 50%，判断还需要扩容两个容器；

最低0.47元/天解锁文章

阿里云技术

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Kubernetes 弹性伸缩全场景解读（二）- HPA 的原理与演进

前言在上一篇文章Kubernetes 弹性伸缩全场景解析（一）：概念延伸与组件布局中，我们介绍了在 Kubernetes 在处理弹性伸缩时的设计理念以及相关组件的布局，在今天这篇文章中，会为大家介绍在 Kubernetes 中弹性伸缩最常用的组件 HPA（Horizontal Pod Autoscaler）。HPA 是通过计算 Pod 的实际工作负载进行重新容量规划的组件，在资源池符合满足...
复制链接

扫一扫