一:前言
在kubernetes中,Pod是最基础的调度单位,多个pod 可以组成一个集合,这个集合向外提供服务。这时候,我们需要以下两种情形需要关注:
1)集合中的Pod可能会由于某种原因Fail,这时候需要某种机制能够创建新的Pod以确保有足够数量的Pod在运行。
2)Pod 的个数由访问请求决定。即当前实例个数不足以满足访问请求时,需要增加实例个数,反之,需要通过某种策略减少实例数。
如果人工来实时监控实例的运行状态,手动启动新的pod以替代fail的pod,监控实例的负载情况,手动创建或者删除pod,这个工作繁琐且工作量大,好在kubernetes已经有相应的机制来应对这种变化。
本篇文章主要介绍在k8s1.2版本下,HPA基于CPU的弹性伸缩。
二:部署目标
- 运行一个php-apache实例
- 创建一个基于CPU弹性的HPA资源
- 对实例进行压测
- 对HPA进行验证
三:HPA原理图 ##
Kubernetes有一个HPA(Horizontal Pod Autoscaler)的资源,可以实现基于CPU使用率的Pod自动伸缩的功能。HPA基于Master Node上的kube-controller-manager服务启动参数–horizontal-pod-autoscaler-sync-period定义的时长(默认为30秒),周期性的检测Pod的CPU使用率(需要事先安装heapster)。如果需要设置–horizontal-pod-autoscaler-sync-period可以在Master Node上的/etc/default/kube-controller-manager中修改。
四:部署步骤
创建php-apache实例的RC
通过kubectl create -f php-rc.yaml文件创建RC.
文件内容如下:
apiVersion: v1
kind: ReplicationController
metadata:
name: php-apache
spec:
replicas: 1
template:
metadata:
name: php-apache
labels:
app: php-apache
spec:
containers:
- name: php-apache
image: gcr.io/google_containers/hpa-example