一、说明:官网地址污点和容忍度 | Kubernetes
1、Taints和Tolerations
- NodeAffinity是节点亲和性,是在Pod上定义的一种属性, 使得Pod能够被调度到某些Node上运行(优先选择或强制要求)。Taint 则是让Node拒绝Pod的运行。
- Taint需要和Toleration配合使用,让Pod避开那些不合适的Node。在 Node上设置一个或多个Taint之后,除非Pod明确声明能够容忍这些污 点,否则无法在这些Node上运行。Toleration是Pod的属性,让Pod能够 (注意,只是能够,而非必须)运行在标注了Taint的Node上。
2、污点的模式
key=value:effect
effect包含了三个值:
1.NoSchedule:不会将pod调度到具有该污点的节点上
2.PreferNoSchedule:尽量避免把pod调度到具有该污点的节点上
3.NoExecute:不会将pod调度到具有该污点的节点上,同时也会将正在运行的进行pod驱逐
k8s集群中的master节点,默认存在污点所以pod默认不会调度到master节点上;
[root@master ~]# kubectl get no -o yaml | grep taints -A 3
taints:
- effect: NoSchedule
key: node-role.kubernetes.io/master
status:
二、Tolerations应用:
给node1节点添加污点,这个设置为node1加上了一个Taint。该Taint的键为key,值为 value,Taint的效果是NoSchedule。这意味着除非Pod明确声明可以容忍 这个Taint,否则就不会被调度到node1上。
如果pod不能够容忍effect的值为NoExecute,那么pod将马上驱逐。
如果pod能够容忍effect的值为NoExecute,且没有定义tolerationSeconds,那么pod将会一直在该节点上运行。如果pod能够容忍effect的值为NoExecute ,但是在toleration定义中指定了tolerationSeconds,那么pod还能够在节点上的时间就是该选项设置的值
kubectl taint node node1 key1=value:NoSchedule #给node1节点添加NoSchedule污点
kubectl taint node node2 key2=value:NoExecute #给node1节点添加NoSchedule污点
匹配污点:
如果pod不能够容忍effect的值为NoExecute,那么pod将马上驱逐
如果pod能够容忍effect的值为NoExecute,且没有定义tolerationSeconds,那么pod将会一直在该节点上运行
如果pod能够容忍effect的值为NoExecute ,但是在toleration定义中指定了tolerationSeconds,那么pod还能够在节点上的时间就是该选项设置的值
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deploy
labels:
app: nginx-deploy
spec:
replicas: 6
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx-pod
image: nginx:latest
imagePullPolicy: IfNotPresent
ports:
- containerPort: 80
tolerations: #容忍度配置
- key: "key2" #匹配键名为key2的污点
operator: "Equal" #相当于等于
value: "value"
effect: "NoExecute" #允许容忍该类型的污点
tolerationSeconds: 30 #表示可以在该节点运行30秒
##################################################################
字段名称的概述
key、value、effect和我们定义污点时写的一样
operator:Equal(等于)、Exists(通配符作用)
Exists的应用
当key值和effect都不指定的时,operator为Exists,表示容忍所有的污点(key、value、effect)
tolerations:
- operator: “Exists”
当不指定effect值时,表示能匹配污点key对应的所有effect情况
tolerations:
- key: “key”
operator: “Exists”
三、多个污点多容忍的应用
我们可以为node节点设置多个污点,也可以为pod设置多个容忍,k8s处理处理多个污点和容忍的过程就像一个过滤器,在节点定义的污点和在pod容忍里面定义的污点两者相匹配,匹配到相同的污点则过滤掉,未被过滤的就留下作为pod调度到节点的依据,通常有以下三种情况
1.当未被过滤的污点值为NoSchedule时,不会将pod分配到该节点
2.当未被过滤的污点值为PreferNoSchedule时,尽量不要调度到该节点,存在没地方调用在调用到该节点
3.当未被过滤的污点值为NoExecute时,不会将pod分配到该节点(pod还未在节点上运行),如果运行了则从该节点驱逐
为node节点添加污点(上面添加的污点保留)
[root@master ~]# kubectl taint node node1 type=node1:NoExecute
[root@master ~]# kubectl taint node node2 type=node2:PreferNoSchedule
查看污点
[root@master ~]# kubectl describe node node1 | grep "Taints" -A 5
Taints: type=node1:NoExecute
key1=value:NoSchedule
[root@master ~]# kubectl describe node node2 | grep "Taints" -A 5
Taints: key2=value:NoExecute
type=node2:PreferNoSchedule
编写一个deployment
apiVersion: apps/v1
kind: Deployment
metadata:
name: deploy-taint
labels:
app: deploy-taint
spec:
replicas: 6
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx-pod
image: nginx:latest
imagePullPolicy: IfNotPresent
ports:
- containerPort: 80
tolerations:
- key: "key2" #容忍键名为key2的污点
operator: "Equal"
value: "value"
effect: "NoExecute" #允许容忍该类型的污点
- key: "type" #容忍键名为type的污点
operator: "Exists" #容忍键名为type的污点,且effect为任何类型
综上所写,pod最终会被调度node2节点
pod第一个污点匹配node2节点
pod第二个污点同时匹配了node1和node2
node1额外多出了一个污点key1=value:NoSchedule表示不会将pod调度到该节点上,所以pod不会被调度到该节点上
只有node2匹配成功,所有最终会被调度到node2节点