摘要:
Kubernetes的生态地位已经确立,可扩展性将是其发力的主战场。异构计算作为非常重要的新战场,Kubernetes非常重视。而异构计算需要强大的计算力和高性能网络,需要提供一种统一的方式与GPU、FPGA、NIC、InfiniBand等高性能硬件集成。
Kubernetes的Device Plugin设计解读
最近在调研Kubernetes的GPU调度和运行机制,发现传统的
alpha.kubernetes.io/nvidia-gpu
即将在1.11版本中下线,和GPU相关的调度和部署的代码将彻底从主干代码中移除。
取而代之的是通过
Extended Resource
+
Device Plugin
两个Kubernetes的内置模块,外加由设备提供商实现的相应Device Plugin, 完成从设备的集群级别调度至工作节点,到设备与容器的实际绑定。
首先思考的第一个问题是为什么进入
alpha.kubernetes.io/nvidia-gpu
主干一年之久的GPU功能彻底移除?