如何使用 NVIDIA MPS 提高 Kubernetes 中的 GPU 利用率

在 Kubernetes 中集成 NVIDIA 多进程服务 (MPS) 以在工作负载之间共享 GPU,从而最大限度地提高利用率并降低基础设施成本

大多数工作负载不需要每个 GPU 的全部内存和计算资源。因此,在多个进程之间共享 GPU 对于提高 GPU 利用率和降低基础架构成本至关重要。

在 Kubernetes 中,这可以通过将单个 GPU 公开为特定内存和计算大小的多个资源(即切片)来实现,这些资源可以由各个容器请求。通过创建每个容器严格需要大小的 GPU 切片,您可以释放集群中的资源。这些资源可以用来调度额外的 Pod,或者可以让你减少集群的节点数量。在任何一种情况下,在进程之间共享 GPU 都可以降低基础设施成本。

Kubernetes 中的 GPU 支持由NVIDIA Kubernetes Device Plugin提供,目前仅支持两种共享策略:时间切片和多实例 GPU (MIG)。然而,还有第三种 GPU 共享策略平衡了时间分片和 MIG 的优缺点:多进程服务(MPS)。尽管 NVIDIA Device Plugin 不支持 MPS,但有一种方法可以在 Kubernetes 中使用它。

在本文中,我们将首先研究所有三种 GPU 共享技术的优缺点,然后提供有关如何在 Kubernetes 中使用 MPS 的分步指南。此外,我们还提供了一种用于自动管理 MPS 资源以优化利用率和降低运营成本的解决方案:动态 MPS 分区。

GPU共享技术概述

共有三种共享 GPU 的方法:

  • 时间分片
  • 多实例 GPU (MIG)
  • 多进程服务 (MPS)

在深入了解动态 MPS 分区的演示之前࿰

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

知识大胖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值