NVIDIA Kubernetes 设备插件使用指南

最新推荐文章于 2025-02-14 10:58:59 发布

温艾琴Wonderful

最新推荐文章于 2025-02-14 10:58:59 发布

阅读量1k

点赞数 24

本文链接：https://blog.csdn.net/gitblog_00221/article/details/141044008

版权

NVIDIA Kubernetes 设备插件使用指南

k8s-device-pluginNVIDIA device plugin for Kubernetes项目地址:https://gitcode.com/gh_mirrors/k8s/k8s-device-plugin

项目介绍

NVIDIA Kubernetes 设备插件是一个用于 Kubernetes 的开源项目，旨在简化在 Kubernetes 集群中管理和使用 NVIDIA GPU 设备的过程。该项目通过实现 Kubernetes 的设备插件接口，使得 GPU 资源可以像其他 Kubernetes 资源一样被管理和调度。

项目快速启动

以下是快速启动 NVIDIA Kubernetes 设备插件的步骤：

1. 克隆项目仓库

git clone https://github.com/NVIDIA/k8s-device-plugin.git
cd k8s-device-plugin

2. 构建 Docker 镜像

docker build -t nvidia-device-plugin:1.0.0 .

3. 部署设备插件

kubectl apply -f https://raw.githubusercontent.com/NVIDIA/k8s-device-plugin/master/nvidia-device-plugin.yml

4. 创建 Pod 请求 GPU 资源

apiVersion: v1
kind: Pod
metadata:
  name: pod1
spec:
  restartPolicy: OnFailure
  containers:
  - image: nvidia/cuda
    name: pod1-ctr
    command: ["sleep"]
    args: ["100000"]
    resources:
      limits:
        nvidia.com/gpu: 1