k8s-scheduler原理分析

最新推荐文章于 2024-08-28 11:33:20 发布

SimminonGarcia

最新推荐文章于 2024-08-28 11:33:20 发布

阅读量445

点赞数

原文链接：http://www.cnblogs.com/sichenzhao/p/9320110.html

版权

scheduler在整个系统中承担了承上启下的重要功能，承上是指它负责接收controller manager创建新的Pod，为其安排一个落脚的目标Node，启下是指安置工作完成后，目标Node上的kubelet服务进程接管后继工作。

也就是说scheduler的作用是通过调度算法为待调度Pod列表上的每一个Pod从Node列表中选择一个最合适的Node。

k8s scheduler当前提供的默认调度流程分为两步

1.预选调度过程，即遍历所有目标Node，筛选出符合要求的候选节点，为了，k8是内置了多种预选策略供用户选择。

2.确定最优节点，在第一步的基础上，采用优选策略（xxx priority）计算出每个候选节点的积分，积分最高者胜出。

调度流程的具体实现是通过插件方式加载的调度算法提供者（algorithmProvider），一个algorithmProvider其实就包含了一组预算策略与一组优先选择策略的结构体，注册algorithmProvider的函数如下：

func RegisterAlgorithmProvider(name string, predicateKeys, priorityKeys)

包含三个参数，第一个参数是算法名，第二个参数为算法用到的预选策略集合，第三个为优选策略集合。

可用的预选策略包含：NoDiskConflict、PodFitsResources，PodSelectorMatches，PodFItsHost等。

其默认的algorithmProvider加载的预选策略Predicate包括：PodFItsHost，PodFitsResources，NoDiskConflict，MatchNodeSelector和Hostname。

也就是说只有每个节点通过这五个默认预选策略后，才能初步选中，进入下一个流程，也就是优选流程。

下面列出所有预选策略的详细说明：

1.NoDiskConflict

判断备选Pod的GCEPresidentDisk（谷歌云）或AWSElasticBlockStore（亚马逊云）和备选节点中已存在的Pod是否存在冲突。如果检查完备选Pod的所有volume与备选节点上的pod的每个volume均为发现冲突，则返回true，表明不存在冲突。反馈给调度器该备选节点适合备选的Pod。

2.PodFitsResource

判断备选节点的资源是否满足备选Pod的需求。

若备选pod和节点中已存在Pod的所有容器的需求资源的总和超过了备选节点拥有的资源，则返回flase，否则true。

3.PodsSelectorMatches

判断备选节点是否包含备选Pod的标签选择器指定的标签。

如果pod没有指定spec.nodeSelector标签选择器，则返回true。

否则，获得备选节点的标签信息，判断节点是否包含备选Pod的标签选择器所指定的标签。若包含则返回true，否则false。

4.PodFitsHost

判断备选Pod的spec.nodename所指定的节点名称与备选节点名称是否一致，若一致，则返回true，否则false。

5.checkNodeLabelPresence

如果用户在配置文件汇总指定了该策略，则scheduler会通过RegisterCustomFitPredicate方法注册该策略，该策略用于判断策略列出的标签在备选节点中存在时，是否选择该备份节点。

首先读取备份节点的标签列表信息