一、背景
最近由于业务量激增,导致负责主要业务的 pod 副本数量不足,所以临时又增加了几个副本。本以为这样就 OK 了,但是没想到新增加的 pod 副本都被分配到了同一个节点上,致使该节点资源紧张最终出现异常(该节点上的 pod 副本无法正常启动)。
就此问题,下面的内容里我将介绍下我们的解决方案。
二、解决方案
我们是通过借助 K8s 的「pod 非亲缘性」来解决这个问题,先看一段儿 Deployment 的 yaml 文件片段截图:
字段解释:
- podAntiAffinity
通过定义 podAntiAffinity 来制定 pod 的非亲缘性策略,与此相反的是 podAffinity(亲缘性)。 - requiredDuringSchedulingIgnoredDuringExecution
通过该字段来决定 pod 非亲缘性是强制性要求(绝不允许 1 个以上的 annoroad-alpha pod 运行在同一个节点),与此相反的是软性要求(非强制性要求,也就是说 >=2 个 annoroad-alpha pod 运行在一个节点上也没啥大问题),我们可以通过 preferredDuringSchedulingIgnoredDuringExecution 来实现软性要求。 - labelSelector
这里的 labelSelector 和 Deployment 创建的 pod 匹配,如下图:
- topologyKey
通过该字段来决定 pod 不能被调度的范围。可以使用这个字段来决定 pod 不能被调度到同一个机柜、可用性区域、地域,或者任何你创建的自定义节点标签标示的范围。这里的 kubernetes.io/hostname 表示同一主机。