查看所有节点的调度状态
命令一:简化版的查看
kubectl get nodes -o wide
状态信息如下:
命令二:更详细的输出
kubectl get nodes -o='custom-columns=NodeName:.metadata.name,TaintKey:.spec.taints[*].key,TaintValue:.spec.taints[*].value,TaintEffect:.spec.taints[*].effect'
状态信息如下
标记节点不可调度
执行完如下命令,该节点不会再接受新的 pod 运行
kubectl cordon my-node
执行完这条命令,节点特定字段值会被更新成如下值:
STATUS = Ready,SchedulingDisabled
TaintKey = node.kubernetes.io/unschedulable
TaintEffect = NoSchedule
恢复节点调度
kubectl uncordon my-node
驱逐节点 Pod
查看节点上所有的 Pod:
kubectl get pod --all-namespaces -owide --field-selector spec.nodeName=hd
然后驱逐所有 Pod:
kubectl drain my-node
这里需要注意的是如果节点上 绑定了本地存储的 Pod 或者一些守护进程集管理的 Pod,将提示错误:
“error: unable to drain node "my-node", aborting command...”, 驱逐命令将不会生效,可以增加下面的参数进行强制驱逐:
kubectl drain my-node --delete-emptydir-data --ignore-daemonsets
- --delete-emptydir-data:强制驱逐节点上绑定了本地存储的Pod,例如coredns。
- --ignore-daemonsets:忽略节点上的守护进程集Pod
命令执行成功后,该节点自动会被标记为不可调度,即会自动被打上 node.kubernetes.io/unschedulable 的污点
注意:驱逐成功后节点有可能会保留不可驱逐的系统级 Pod,这属于正常的