一:device-plugin能做什么:
在k8s中使用gpu资源和设备过程中想到如下几个问题:
1.如何在不修改k8s任何组件的情况下引入除cpu,memory外的第三方资源
2.kubelet在创建docker的时候如何让docker使用到node的gpu资源。
3.k8s在调度任务的时候如何识别到第三方资源(上层调度器如何看到底层资源和设备)。
针对引入第三方资源的问题,社区给出了解决方案:community/device-plugin.md at master · kubernetes/community · GitHub
该方案的目的是:通过device-plugin,将系统硬件资源(也可以是虚拟资源)发布到 kubelet,而无需修改kubernetes任何代码。
二:device-plugin原理
device-plugin其实就是一个grpc服务,他主要做如下几件事:
1.向kubelet注册资源和设备
2.当设备发生变化时,向kubelet更新
3.接受kubelet申请第三方资源,并以参数的形式返回给kubelet
参考时序图:
三:调度器识别使用device-plugin资源
在测试cola-device-plugin(GitHub - joyme123/cola-device-plugin: kubernetes device plugin的开发示例)时,发现并没有对k8s调度器做任何扩展,调度器就识别到了插件中的自定义资源。那有没有想过一个问题,调度器到底是如何识别到该资源的。
从上面时序图中可以看到插件会向kubelet注册更新资源,kubelet又会向api-server发送节点状态信息
我们describe node查看node的资源上报情况
自定义资源cola上报给了api-server。
首先,在k8s源码中找到NodeStatus对象查看capacity和allocatable两个字段
发现这两个字段都是map类型
再查看调度器源码
发现ScalerResources这个字段
又找到ResourceList这个方法,该方法可以返回所有资源类型
这下就解释了在不扩展调度器的情况下,调度器是如何发现第三方资源的