一:前言
在kubernetes中,Pod是最基础的调度单位,多个pod 可以组成一个集合,这个集合向外提供服务。这时候,我们需要以下两种情形需要关注:
1)集合中的Pod可能会由于某种原因Fail,这时候需要某种机制能够创建新的Pod以确保有足够数量的Pod在运行。
2)Pod 的个数由访问请求决定。即当前实例个数不足以满足访问请求时,需要增加实例个数,反之,需要通过某种策略减少实例数。
如果人工来实时监控实例的运行状态,手动启动新的pod以替代fail的pod,监控实例的负载情况,手动创建或者删除pod,这个工作繁琐且工作量大,好在kubernetes已经有相应的机制来应对这种变化。
本篇文章主要介绍在k8s1.2版本下,HPA基于CPU的弹性伸缩。
二:部署目标
- 运行一个php-apache实例
- 创建一个基于CPU弹性的HPA资源
- 对实例进行压测
- 对HPA进行验证
三:HPA原理图 ##
Kubernetes有一个HPA(Horizontal Pod Autoscaler)的资源,可以实现基于CPU使用率的Pod自动伸缩的功能。HPA基于Master Node上的kube-controller-manager服务启动参数–horizontal-pod-autoscaler-sync-period定义的时长(默认为30秒),周期性的检测Pod的CPU使用率(需要事先安装heapster)。如果需要设置–horizontal-pod-autoscaler-sync-period可以在Master Node上的/etc/default/kube-controller-manager中修改。
四:部署步骤
创建php-apache实例的RC
通过kubectl create -f php-rc.yaml文件创建RC.
文件内容如下:
apiVersion: v1
kind: ReplicationController
metadata:
name: php-apache
spec:
replicas: 1
template:
metadata:
name: php-apache
labels:
app: php-apache
spec:
containers:
- name: php-apache
image: gcr.io/google_containers/hpa-example:latest
imagePullPolicy: IfNotPresent
resources:
requests:
cpu: 200m
ports:
- containerPort: 80
创建php-apache实例的SVC
通过kubectl create -f php-svc.yaml文件创建SVC.文件内容如下:
apiVersion: v1
kind: Service
metadata:
name: php-apache
labels:
k8s-app: php-apache
spec:
ports:
# The port that this service should serve on.
- port: 80
# Label keys and values that must match in order to receive traffic for this service.
selector:
app: php-apache
创建HPA
通过kubectl create -f hpa-example.yaml文件创建HPA.文件内容如下:
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: php-apache
namespace: default
spec:
scaleTargetRef:
apiVersion: v1
kind: ReplicationController
name: php-apache
minReplicas: 1
maxReplicas: 10
targetCPUUtilizationPercentage: 50
查看创建的hpa,结果发现当前的CPU使用率CURRENT显示为waiting.
# kubectl get hpa php-apache
NAME REFERENCE TARGET CURRENT MINPODS MAXPODS AGE
php-apache ReplicationController/php-apache/scale 50% <waiting> 1 10 8s
注意:有可能是由于heapster组件没有安装,也有可能是数据没有检测到,默认heapster采集时间为1分,需要稍等一会看一下状态。
# kubectl get hpa php-apache
NAME REFERENCE TARGET CURRENT MINPODS MAXPODS AGE
php-apache ReplicationController/php-apache/scale 50% 0% 1 10 60s
如果要查看hpa的事件,kubectl describe hpa php-apache ,会出这些错误信息
MetricsNotAvailableYet unable to get metrics for resource cpu: no metrics returned from heapster。
这种错误信息需要稍等一会多看几次,分析一下是什么原因导致的,有可能只是时间差导致的。
对php-apache进行压力测试
kubectl run -i --tty load-generator --image=busybox:latest /bin/sh #进入容器后执行一下命令
while true; do wget -q -O- http://php-apache.default.svc.cluster.local; done
压测几分钟后查看hpa状态,如果cpu压力超过了设置的阈值,可以停止压测。
查看hpa状态:
NAME REFERENCE TARGET CURRENT MINPODS MAXPODS AGE
php-apache ReplicationController/php-apache/scale 50% 200% 1 10 60s
状态已经超过了阈值,此时查看pod,pod的数量已经增加了。
root@ansible:/data/hpa/k81.2/autoscaling_v1/cpu/rc# kubectl get pods
NAME READY STATUS RESTARTS AGE
load-generator-535521892-scxsg 1/1 Running 0 6d
ache-1czu1 1/1 Running 0 6d
php-apache-a4g4x 1/1 Running 0 6d
php-apache-d2nn1 1/1 Running 0 6d
php-apache-epnpf 1/1 Running 0 6d
php-apache-ffuhk 1/1 Running 0 6d
php-apache-g78ms 1/1 Running 0 6d
php-apache-nglin 1/1 Running 0 6d
php-apache-sxz5y 1/1 Running 0 7d
php-apache-t7s8e 1/1 Running 0 6d
php-apache-v7zxm 1/1 Running 0 6d
当停止压力测试之后,过一段时间,Pod数量又会恢复到1。
四:总结
- 上述操作也可以通过kubectl命令执行,但是我测试是有问题的,如果想要通过命令可以参考官方文档HPA官方文档
- 在kubernetes1.2中伸缩Deployment也有些许问题,可以在自行验证
- HPA其他指标的支持按照官方文档v1.6.1中已经支持了。内存的我验证过后续文章为介绍。
本文详细介绍了在kubernetes 1.2版本中,如何利用Horizontal Pod Autoscaler (HPA)实现基于CPU使用率的Pod自动伸缩。从部署目标、HPA原理到具体的步骤,包括创建php-apache实例、设置HPA资源以及进行压力测试以验证HPA的效果。文中还提到了可能遇到的问题和解决方案,并指出在1.2版本中对Deployment的伸缩存在一些问题,但在后续版本中已得到改进。
764

被折叠的 条评论
为什么被折叠?



