一、HPA介绍
HPA的全称为(Horizontal Pod Autoscaling),通俗的理解下HPA就是对deployment进行扩缩容的一个管理机制,他会监测pod的cpu和memory的使用情况,当cpu或memory达到一个值,为了能够使服务正常运行,他会进行扩容增加pod,来分担压力,当pod的使用比较空闲稳定的时候,他会自动的进行缩容,但缩容的速度远远慢于扩容的速度,防止pod再一次达到阈值。
这是hpa扩容的原理图,其中有个metrics Server的API,HPA控制器通过Metrics Server的API(Heapster的API或聚合API)获取这些数据,基于用户定义的扩缩容规则进行计算,得到目标Pod副本数量。
二、介绍HPA三个版本
我们在使用apiVersion创建资源的时候,有些版本分为很多种,就像hpa,他就有三个版本
第一个版本:autosacling/v1 这是最简单的一个版本,所涵盖的内容比较少,但是使用简单,如果做一些简单的扩缩容可以使用此版本
第二个版本:autoscaling/v2beta1 这是在v1的基础上演变的 多了一个metric模块
第三个版本: autoscaling/v2beta2 这个版本就比较详细了,内容也比较丰富,主要新增了扩缩容灵敏度的控制,下文的例子就是使用的这个版本
我们如果想知道一个apiversion有多少版本的时候 可以使用: kubectl api-versions |grep 版本名称
kubectl api-resources 还可以查看所有资源
同时kubectl explain hpa --api-version=autoscaling/v2beta2
还可以指定查看某一个版本下的具体信息
三、HPA实例
我们首先创建一个deploy 然后再创建hpa指定这个deploy进程扩缩容管理
apiVersion: apps/v1
kind: Deployment
metadata:
creationTimestamp: null
labels:
app: web
name: web
spec:
replicas: 1
selector:
matchLabels:
app: web
strategy: {}
template:
metadata:
creationTimestamp: null
labels:
app: web
spec:
containers:
- image: nginx:latest
name: nginx
imagePullPolicy: IfNotPresent
ports:
- containerPort: 80
resources:
limits:
cpu: "10m"
memory: 20Mi
requests:
cpu: "10m"
memory: 20Mi
status: {}
# 注意 在创建deploy的时候一定要限制pod的资源配额 资源配额在前几章也说过
下面创建HPA
apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
name: web-hpa
spec:
minReplicas: 1 #最少副本
maxReplicas: 1000 #最多副本
scaleTargetRef: #指定目标
apiVersion: apps/v1
kind: Deployment
name: web
metrics: #对哪个资源进行监控
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 80
behavior: #这里是重点 设置扩缩容的灵敏度
scaleUp:
stabilizationWindowSeconds: 5 # 在五秒之内进程扩容
policies:
- type: Percent #按照百分比进行扩容
value: 900 #90%
periodSeconds: 5 %每五秒扩容一次
对于behavior下的polices模块我们还可以这样写
policies:
- type: pods
value: 1
每次只新增一个pod
polices:
- type: pods
value: 0
禁止HPA扩容 (这条我认为没有什么意义,我们使用hpa就是为了进行扩缩容)
结语:
以上就是HPA简单的介绍和操作流程