引入
对于运行各种负载(如Service、Job)的中等规模或者大规模的集 群来说,出于各种原因,我们需要尽可能提高集群的资源利用率。而提 高资源利用率的常规做法是采用优先级方案,即不同类型的负载对应不同的优先级,同时允许集群中的所有负载所需的资源总量超过集群可提供的资源,在这种情况下,当发生资源不足的情况时,系统可以选择释 放一些不重要的负载(优先级最低的),保障最重要的负载能够获取足够的资源稳定运行
优先级抢占调度策略的核心行为分别是
- 驱逐 (Eviction):kubelet进程的行为
- 抢占 (Preemption):Scheduler执行的行为
驱逐
即当一个Node发生资源不足(under resource pressure)的情况时,该节点上的kubelet进程会执行驱逐动作,此时 Kubelet会综合考虑Pod的优先级、资源申请量与实际使用量等信息来计 算哪些Pod需要被驱逐;当同样优先级的Pod需要被驱逐时,实际使用的 资源量超过申请量最大倍数的高耗能Pod会被首先驱逐。对于QoS等级 为“Best Effort”的Pod来说,由于没有定义资源申请(CPU/Memory Request),所以它们实际使用的资源可能非常大
抢占
当一个新的Pod因为资源无法满足而不能被调度 时,Scheduler可能(有权决定)选择驱逐部分低优先级的Pod实例来满 足此Pod的调度目标,这就是Preemption机制
Pod优先级调度示例如下
首先,由集群管理员创建PriorityClasses,PriorityClass不属于任何 命名空间:
apiVersion: scheduling.k8s.io/v1beta1
kind: PriorityClass
metadata:
name:
labels:
version: v1
value: 10000
globalDefault: false
description: "miao shu xing yu ju"
上述YAML文件定义了一个名为high-priority的优先级类别,优先级
为100000,数字越大,优先级越高,超过一亿的数字被系统保留,用于 指派给系统组件
我们可以在任意Pod中引用上述Pod优先级类别:
apiVersion: v1
kind: Pod
metadata:
labels:
test: nginx
name: nginx
spec:
containers:
- name: nginx
image: nginx
ports:
- name: http
containerPort: 80
tolerations:
- key: version
operator: Exists
effect: NoSchedule
priorityClassName: high
根据描述可以看到优先级