一张图掌握Volcano Device plugin的核心，压箱底

Hugo Lei

于 2024-06-05 23:57:21 发布

阅读量700

点赞数 13

分类专栏： AI视觉解决方案文章标签： k8s 云原生 AI Infra AI开发平台

本文链接：https://blog.csdn.net/hugo_lei/article/details/139484844

版权

9 篇文章 1 订阅

订阅专栏

Volcano Device plugin核心流程图

本质逻辑是共享GPU mem

通过nvml获取设备信息

ResourceName：例如volcano.sh/gpu-memory

kubelet会给node打标volcano.sh/gpu-memory = 虚拟设备的数量

如果是gpu-memory模式，则打标

node.status.capacity

volcano.sh/gpu-number = 物理GPU数量

（gpu-number模式是device plugin打标，gpu-memory模式下，将资源注册到kubelet后，volcano.sh/gpu-memory这个标是kubelet打的）

GPU mem一份是1M，在software上将GPU分成若干虚拟GPU

若是GPU mem共享（向kubelet注册的ResourceName=volcano.sh/gpu-memory），就将虚拟GPUs推给kubelet（注意是虚拟GPU设备，因一般以1M为一份，所以数量也就代表了mem的大小，这里是多张卡的总虚拟设备数）
- 虚拟GPU的ID=真实id-虚拟id
若是GPU number也即独享，就将物理GPU信息推给kubelet

Device Plugin的Allocate重点是做一些pre工作，如生成配置等，返回给kubelet，然后kubelet带着这些配置调用docker，docker再调用docker runtime

参考ContainerAllocateResponse，Allocate会返回如下信息：

kubelet访问Device Plugin的Allocate接口，带入的参数是deviceIDs

并没有实际分配GPU资源

获取所有pending的pod
找到需要分配GPU mem的pod
找到pod的Annotation里的volcano.sh/gpu-index（格式1,2,3,4,5，这个是kubelet分配的gpu的index）
更新pod的Annotation，volcano.sh/gpu-assigned = true（表示已分配）
生成ContainerAllocateResponse
1. Envs：(会设置到pod内)
  1. NVIDIA_VISIBLE_DEVICES：
  2. VOLCANO_GPU_ALLOCATED：实际申请的GPU mem大小
  3. VOLCANO_GPU_MEMORY_TOTAL：GPU原始显存