一:前言
在kubernetes中,Pod是最基础的调度单位,多个pod 可以组成一个集合,这个集合向外提供服务。这时候,我们需要以下两种情形需要关注:
1)集合中的Pod可能会由于某种原因Fail,这时候需要某种机制能够创建新的Pod以确保有足够数量的Pod在运行。
2)Pod 的个数由访问请求决定。即当前实例个数不足以满足访问请求时,需要增加实例个数,反之,需要通过某种策略减少实例数。
如果人工来实时监控实例的运行状态,手动启动新的pod以替代fail的pod,监控实例的负载情况,手动创建或者删除pod,这个工作繁琐且工作量大,好在kubernetes已经有相应的机制来应对这种变化。
本篇文章主要介绍在k8s1.6版本以上,k8s1.8版本一下,HPA基于CPU、Memory的弹性伸缩,采用heaspter收集的监控指标。
二:部署目标
- 运行一个php-apache-cpu实例
- 创建一个基于CPU弹性的HPA资源
- 对实例进行压测
- 对HPA进行验证
- 运行一个php-apache-memory实例
- 创建一个基于Memory弹性的HPA资源
- 对实例进行压测
- 对HPA进行验证
三:HPA原理图 ##
Kubernetes有一个HPA(Horizontal Pod Autoscaler)的资源,可以实现基于CPU使用率的Pod自动伸缩的功能。HPA基于Master Node上的kube-controller-manager服务启动参数–horizontal-pod-autoscaler-sync-period定义的时长(默认为30秒),周期性的检测Pod的CPU使用率(需要事先安装heapster)。如果需要设置–horizontal-pod-autoscaler-sync-period可以在Master Node上的/etc/default/kube-controller-manager中修改。
四:部署步骤
基于CPU的HPA
创建php-apache-cpu实例的Deployment和Service
通过kubectl 命令创建Deployment和Service.
命令如下:
kubectl run php-apache-cpu --image=gcr.io/google_containers/hpa-examplel:v1.0 --requests=cpu=200m --expose --port=80
service "php-apache-cpu" created
deployment "php-apache-cpu” created
创建HPA可以通过命令行和yaml文件创建。
yaml文件方式
通过kubectl create -f hpa-cpu-example.yaml文件创建HPA.文件内容如下:
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: php-apache
namespace: default
spec:
scaleTargetRef:
apiVersion: v1
kind: Deployment
name: php-apache-cpu
minReplicas: 1
maxReplicas: 10
targetCPUUtilizationPercentage: