如何看待生产环境中的kubernetes 优先级与抢占

最新推荐文章于 2023-11-21 17:20:31 发布

AI乔治

最新推荐文章于 2023-11-21 17:20:31 发布

阅读量245

点赞数

分类专栏： java 架构文章标签： Java 架构编程语言程序人生 kubernetes

本文链接：https://blog.csdn.net/lanzhupi/article/details/112550171

版权

本文探讨了kubernetes中优先级与抢占功能的基本原理和生产环境使用方式，强调了合理配置以避免意外故障。通过设置PriorityClass和resourceQuota，可以控制高优先级pod的调度和资源使用，防止低优先级pod被抢占。同时，文章提出对于某些不允许被抢占的中间优先级任务，需要自定义抢占策略，并逐步改进任务以支持中断和恢复。

摘要由CSDN通过智能技术生成

kubernetes 中的抢占功能是调度器比较重要的feature，但是真正使用起来还是比较危险，否则很容易把低优先级的pod给无辜kill。为了提高GPU集群的资源利用率，决定勇于尝试一番该featrue。当然使用之前还是得阅读一下相关的代码做到心里有数，出了问题也方便定位修复。

基本原理

优先级与抢占是为了确保一个高优先级的pod在调度失败后，可以通过"挤走" 低优先级的pod，腾出空间后保证它可以调度成功。我们首先需要在集群中声明PriorityClass来定义优先等级数值和抢占策略，

apiVersion: scheduling.k8s.io/v1
kind: PriorityClass
metadata:
  name: high
value: 10000
preemptionPolicy: Never
globalDefault: false
description: "This priority class should be used for high priority service pods."
---
apiVersion: scheduling.k8s.io/v1
kind: PriorityClass
metadata:
  name: low
value: -999
globalDefault: false
description: "This priority class should be used for log priority service pods."

如上所示定义了两个PriorityClass对象。然后就可以在pod中声明使用它了：

apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    run: nginx
  name: high-nginx
spec:
  replicas: 1
  selector:
    matchLabels:
      run: nginx
  template:
    metadata:
      labels:
        run: nginx
    spec:
      containers:
      - image: nginx
        imagePullPolicy: Always
        name: nginx
        resources:
          limits:
            cpu: "500m"
      priorityClassName: high

这个 Pod 通过 priorityClassName 字段。声明了要使用名叫 high-priority 的 PriorityClass。当这个 Pod 被提交给 Kubernetes 之后，Kubernetes 的 Priority AdmissionControl