Kubernetes集群可以通过Replication Controller的scale机制完成服务的扩容或缩容,实现具有伸缩性的服务。
Kubernetes集群自动伸缩分为:
sacle手动伸缩:kubernetes资源对象的升级、回滚、扩容、缩容
autoscale自动伸缩:也就是本篇博文所介绍的HPA;
Kubernetes自动扩展主要分为:
水平扩展:针对实例数目的增减;
垂直扩展:也就是单个实例就可以使用的资源的增减,比如增加CPU、内存;
一、HPA简介
HPA的全称为(Horizontal Pod Autoscaling)它可以根据当前pod资源的使用率(如CPU、磁盘、内存等),进行副本数的动态的扩容与缩容,以便减轻各个pod的压力。当pod负载达到一定的阈值后,会根据扩缩容的策略生成更多新的pod来分担压力,当pod的使用比较空闲时,在稳定空闲一段时间后,还会自动减少pod的副本数量。
若要实现自动扩缩容的功能,还需要部署heapster服务,用来收集及统计资源的利用率,支持kubectl top命令,heapster服务集成在prometheus(普罗米修斯) MertricServer服务中,所以说,为了方便,我这里基于prometheus服务的环境上进行部署HPA(动态扩缩容)的服务。
可以参考博文Kubernetes的三种可视化UI界面中的第三个部署Prometheus服务,来运行prometheus服务,如果不想部署prometheus,那么可以参考github上来单独部署heapster服务。
说这么多,总之就是想要使用HPA,就必须保证,可以在master节点上执行如下命令:
[root@master kube-prometheus]# kubectl top node
NAME CPU(cores) CPU% MEMORY(bytes) MEMORY%
master 109m 2% 1565Mi 42%
node01 70m 1% 1435Mi