Kubernetes HPA管理

最新推荐文章于 2023-11-27 13:40:31 发布

Giant-Fox

最新推荐文章于 2023-11-27 13:40:31 发布

阅读量467

点赞数 3

分类专栏：云计算文章标签： kubernetes java 容器

本文链接：https://blog.csdn.net/dahulihuli/article/details/127457805

版权

云计算专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一、HPA介绍

HPA的全称为（Horizontal Pod Autoscaling），通俗的理解下HPA就是对deployment进行扩缩容的一个管理机制，他会监测pod的cpu和memory的使用情况，当cpu或memory达到一个值，为了能够使服务正常运行，他会进行扩容增加pod，来分担压力，当pod的使用比较空闲稳定的时候，他会自动的进行缩容，但缩容的速度远远慢于扩容的速度，防止pod再一次达到阈值。

这是hpa扩容的原理图，其中有个metrics Server的API，HPA控制器通过Metrics Server的API（Heapster的API或聚合API）获取这些数据，基于用户定义的扩缩容规则进行计算，得到目标Pod副本数量。

二、介绍HPA三个版本

我们在使用apiVersion创建资源的时候，有些版本分为很多种，就像hpa，他就有三个版本

第一个版本：autosacling/v1 这是最简单的一个版本，所涵盖的内容比较少，但是使用简单，如果做一些简单的扩缩容可以使用此版本

第二个版本：autoscaling/v2beta1 这是在v1的基础上演变的多了一个metric模块

第三个版本： autoscaling/v2beta2 这个版本就比较详细了，内容也比较丰富，主要新增了扩缩容灵敏度的控制，下文的例子就是使用的这个版本

我们如果想知道一个apiversion有多少版本的时候可以使用： kubectl api-versions |grep 版本名称

kubectl api-resources 还可以查看所有资源

同时kubectl explain hpa --api-version=autoscaling/v2beta2

还可以指定查看某一个版本下的具体信息

三、HPA实例

我们首先创建一个deploy 然后再创建hpa指定这个deploy进程扩缩容管理

apiVersion: apps/v1
kind: Deployment
metadata:
creationTimestamp: null
labels:
app: web
name: web
spec:
replicas: 1
selector:
matchLabels:
app: web
strategy: {}
template:
metadata:
creationTimestamp: null
labels:
app: web
spec:
containers:
- image: nginx:latest
name: nginx
imagePullPolicy: IfNotPresent
ports:
- containerPort: 80
resources:
limits:
cpu: "10m"
memory: 20Mi
requests:
cpu: "10m"
memory: 20Mi
status: {}

# 注意在创建deploy的时候一定要限制pod的资源配额资源配额在前几章也说过

下面创建HPA

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
name: web-hpa
spec:
minReplicas: 1 #最少副本
maxReplicas: 1000 #最多副本
scaleTargetRef: #指定目标
apiVersion: apps/v1
kind: Deployment
name: web
metrics: #对哪个资源进行监控
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 80
behavior: #这里是重点设置扩缩容的灵敏度
scaleUp:
stabilizationWindowSeconds: 5 # 在五秒之内进程扩容
policies:
- type: Percent #按照百分比进行扩容
value: 900 #90%
periodSeconds: 5 %每五秒扩容一次

对于behavior下的polices模块我们还可以这样写

policies:

- type: pods

value: 1

每次只新增一个pod

polices:

- type: pods

value: 0

禁止HPA扩容（这条我认为没有什么意义，我们使用hpa就是为了进行扩缩容）

结语：

以上就是HPA简单的介绍和操作流程

Giant-Fox

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Kubernetes HPA管理

我们在使用apiVersion创建资源的时候，有些版本分为很多种，就像hpa，他就有三个版本第一个版本：autosacling/v1 这是最简单的一个版本，所涵盖的内容比较少，但是使用简单，如果做一些简单的扩缩容可以使用此版本第二个版本：autoscaling/v2beta1 这是在v1的基础上演变的多了一个metric模块第三个版本： autoscaling/v2beta2 这个版本就比较详细了，内容也比较丰富，主要新增了扩缩容灵敏度的控制，下文的例子就是使用的这个版本。
复制链接

扫一扫

专栏目录