在 Kubernetes 中手动指定 Pod 运行的节点详解

汪子熙

于 2024-11-25 11:56:50 发布

阅读量1k

点赞数 16

分类专栏： Kubernetes 文章标签： kubernetes 容器云原生

本文链接：https://blog.csdn.net/i042416/article/details/144023917

版权

Kubernetes 专栏收录该内容

92 篇文章

订阅专栏

在 Kubernetes (K8s) 中，有时候需要手动指定 Pod 运行在哪个节点上。这在某些场景下非常重要，例如部署需要特定硬件资源的应用程序，或者为了满足数据本地化和安全隔离的需求。

理解 Kubernetes 的调度机制

在默认情况下，Kubernetes 的调度器会根据节点的资源利用率和预定义的策略，将新创建的 Pod 分配到最合适的节点上。这种自动调度对于大多数应用场景是有效的，但在某些特殊情况下，我们需要更精细的控制。

为什么需要手动指定节点

手动指定 Pod 的运行节点有多种原因：

硬件需求：某些应用需要特定的硬件支持，如 GPU、高速存储或特殊的网络接口。
数据本地化：为了降低延迟或遵守数据合规性，应用需要运行在特定的地理位置。
资源隔离：在多租户环境中，需要将不同的租户的应用隔离在不同的节点上。
性能优化：将高负载的应用分配到性能更好的节点上，以提高整体性能。

方法一：使用节点选择器 (Node Selector)

节点选择器是 Kubernetes 中最简单的约束方法，通过在 Pod 配置中指定 nodeSelector，限制 Pod 只能被调度到带有特定标签的节点上。

步骤：

给节点打标签

首先，需要给目标节点打上特定的标签。例如，将节点标记为具有 SSD 存储：
```
kubectl label nodes node1 disktype=ssd
```
这条命令为名为 node1 的节点添加了标签 disktype=ssd。

在 Pod 配置中使用 nodeSelector

在 Pod 的 YAML 文件中，添加 nodeSelector 字段：

apiVersion: v1
kind: Pod
metadata:
  name: mypod
spec:
  containers:
  - name: mycontainer
    image: myimage
  nodeSelector:
    disktype: ssd

这样，Pod mypod 只会被调度到带有标签 disktype=ssd 的节点上。

实际案例：

假设有一个需要高性能存储的数据库应用，希望将其部署到使用 SSD 的节点上。通过上述步骤，可以确保数据库 Pod 被调度到具有 SSD 的节点，提高数据读写性能。

方法二：使用节点亲和性 (Node Affinity)

节点亲和性是对节点选择器的扩展，提供了更灵活和强大的调度控制，允许使用表达式来指定节点选择条件。

类型：

必须匹配 (requiredDuringSchedulingIgnoredDuringExecution)：Pod 只能调度到满足条件的节点，否则会一直处于 Pending 状态。
优先匹配 (preferredDuringSchedulingIgnoredDuringExecution)：调度器会优先考虑满足条件的节点，但如果没有，也会调度到其他节点。

步骤：

在节点上打标签

假设我们有多个节点，分别标记了不同的区域：

kubectl label nodes node1 region=us-west
kubectl label nodes node2 region=us-east

在 Pod 配置中使用节点亲和性

apiVersion: v1
kind: Pod
metadata:
  name: regional-app
spec:
  containers:
  - name: app-container
    image: app-image
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
        nodeSelectorTerms:
        - matchExpressions:
          - key: region
            operator: In
            values:
            - us-west

这将使 Pod regional-app 只能被调度到 region=us-west 的节点上。

实际案例：

一家跨国公司希望将欧洲用户的请求处理服务部署在欧洲的数据中心，以降低延迟。通过在节点上标记地理区域，并使用节点亲和性，可以确保欧洲的服务只在欧洲的节点上运行。

方法三：使用 Pod 的 `nodeName` 字段

直接指定 nodeName 可以将 Pod 绑定到特定的节点，这种方法会绕过 Kubernetes 的调度器。

步骤：

apiVersion: v1
kind: Pod
metadata:
  name: fixed-node-app
spec:
  containers:
  - name: app-container
    image: app-image
  nodeName: node1

注意事项：

风险：如果指定的节点不可用，Pod 将无法被调度，也不会被重新调度到其他节点。
场景：适用于测试或特殊情况下，需要将 Pod 固定在某个节点上。

实际案例：

在故障排查时，可能需要在特定的节点上运行调试工具。通过直接指定 nodeName，可以确保调试 Pod 运行在目标节点。

方法四：使用污点和容忍度 (Taints and Tolerations)

通过在节点上添加污点，可以防止一般的 Pod 被调度到该节点，只有具有相应容忍度的 Pod 才能被调度到这些节点。

步骤：

为节点添加污点
```
kubectl taint nodes node1 key=value:NoSchedule
```
这将为 node1 添加一个污点，阻止一般的 Pod 被调度到该节点。

在 Pod 中添加容忍度

apiVersion: v1
kind: Pod
metadata:
  name: tolerant-app
spec:
  containers:
  - name: app-container
    image: app-image
  tolerations:
  - key: "key"
    operator: "Equal"
    value: "value"
    effect: "NoSchedule"

这样，Pod tolerant-app 就可以被调度到带有特定污点的节点上。

实际案例：

在集群中，有些节点配置了更高的安全级别，只允许运行特定的应用。通过添加污点，可以防止其他应用被调度到这些节点上，确保安全策略的实施。

方法五：使用自定义调度器

对于更复杂的调度需求，可以使用自定义调度器。自定义调度器可以根据特定的算法或策略，决定 Pod 的调度位置。

步骤：

编写自定义调度器

编写一个符合 Kubernetes 调度器规范的程序，定义自己的调度逻辑。
部署自定义调度器

将自定义调度器作为一个 Pod 运行在集群中。

在 Pod 配置中指定调度器

apiVersion: v1
kind: Pod
metadata:
  name: custom-scheduled-app
spec:
  schedulerName: my-custom-scheduler
  containers:
  - name: app-container
    image: app-image