Pod 自动扩缩容
通过手工执行kubectl scale 命令可以实现Pod 的扩缩容,但是这样毕竟需要每次去手工操作一次,而且不确定什么时候业务请求量就很大了,所以如果不能做到自动化的去扩缩容的话,这也是一个很麻烦的事情。如果Kubernetes 系统能够根据Pod 当前的负载的变化情况来自动的进行扩缩容就好了,因为这个过程本来就是不固定的,频繁发生的,所以纯手工的方式不是很现实。
幸运的是Kubernetes 为我们提供了这样一个资源对象:Horizontal PodAutoscaling(Pod水平自动伸缩),简称HPA 。HAP 通过监控分析RC 或者Deployment 控制的所有Pod 的负载变化情况来确定是否需要调整Pod 的副本数量,这是HPA 最基本的原理。
HPA 在kubernetes 集群中被设计成一个controller ,我们可以简单的通过kubectl autoscale 命令来创建一个HPA 资源对象,HPA Controller默认15s轮询一次(可通过kube-controller-manager的标志–horizontal-pod-autoscaler-sync-period 进行设置),查询指定的资源(RC或者Deployment)中Pod 的资源使用率,并且与创建时设定的值和指标做对比,从而实现自动伸缩的功能。当你创建了HPA 后,HPA 会从RESTClient 端获取每一个Pod 利用率或原始值的平均值,然后和HPA 中定义的指标进行对比,同时计算出需要伸缩的具体值并进行相应的操作。
HPA 官方文档
从 Kubernetes 1.8 开始,资源使用指标(如容器 CPU 和内存使用率)通过 Metrics API 在 Kubernetes 中获取。Metrics Server 实现了ResourceMetrics API,Metrics Server 是集群范围资源使用数据的聚合器
我们来创建一个Deployment 管理的Nginx Pod,然后利用HPA 来进行演示。
apiVersion: apps/v1
kind: Deployment
metadata:
name: demo-hpa
labels:
demo: demo-hpa
spec:
replicas: 2
revisionHistoryLimit: 15
selector:
matchLabels:
demo: nginx
template:
metadata:
labels:
demo: nginx
spec:
containers:
- name: nginx
image: nginx
ports:
- containerPort: 80
resources:
limit:
cpu: 200m
requests:
cpu: 100m
---
apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
name: horizontal
spec:
minReplicas: 2
maxReplicas: 10
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: demo-hpa
metrics:
- type: Resource
resource:
name: cpu
targetAverageUtilization: 20
---
apiVersion: v1
kind: Service
metadata:
name: hpa
labels:
demo: hpa-service
spec:
ports:
- name: hpa-prot
port: 80
targetPort: 80
protocol: TCP
type: NodePort
[root@master ~]# kubectl get hpa
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
horizontal Deployment/demo-hpa 0%/20% 2 10 2 117s
循环访问 while true;do curl 192.168.0.36:31637; done
[root@master ~]# kubectl get hpa
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
horizontal Deployment/demo-hpa 26%/20% 2 10 2 34m
[root@master ~]# kubectl get deployments.apps
NAME READY UP-TO-DATE AVAILABLE AGE
demo-hpa 4/4 4 4 41m
停止循环后
[root@master ~]# sleep 300;kubectl get hpa
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
horizontal Deployment/demo-hpa 0%/20% 2 10 2 49m
不过当前的HPA 只有CPU 使用率这一个指标,还不是很灵活的。
需要注意的是hpa需要结合metrice-server来实现监控
下章讲解metrice