如何使用 NVIDIA MPS 提高 Kubernetes 中的 GPU 利用率

最新推荐文章于 2023-04-08 08:30:35 发布

知识大胖

最新推荐文章于 2023-04-08 08:30:35 发布

阅读量808

点赞数 1

分类专栏： NVIDIA GPU和大语言模型开发教程文章标签： kubernetes docker 容器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/iCloudEnd/article/details/129273818

版权

NVIDIA GPU和大语言模型开发教程专栏收录该内容

该专栏为热销专栏榜第68名

796 篇文章 235 订阅 ¥89.90 ¥99.00

订阅专栏

在 Kubernetes 中集成 NVIDIA 多进程服务 (MPS) 以在工作负载之间共享 GPU，从而最大限度地提高利用率并降低基础设施成本

大多数工作负载不需要每个 GPU 的全部内存和计算资源。因此，在多个进程之间共享 GPU 对于提高 GPU 利用率和降低基础架构成本至关重要。

在 Kubernetes 中，这可以通过将单个 GPU 公开为特定内存和计算大小的多个资源（即切片）来实现，这些资源可以由各个容器请求。通过创建每个容器严格需要大小的 GPU 切片，您可以释放集群中的资源。这些资源可以用来调度额外的 Pod，或者可以让你减少集群的节点数量。在任何一种情况下，在进程之间共享 GPU 都可以降低基础设施成本。

Kubernetes 中的 GPU 支持由NVIDIA Kubernetes Device Plugin提供，目前仅支持两种共享策略：时间切片和多实例 GPU (MIG)。然而，还有第三种 GPU 共享策略平衡了时间分片和 MIG 的优缺点：多进程服务（MPS）。尽管 NVIDIA Device Plugin 不支持 MPS，但有一种方法可以在 Kubernetes 中使用它。

在本文中，我们将首先研究所有三种 GPU 共享技术的优缺点，然后提供有关如何在 Kubernetes 中使用 MPS 的分步指南。此外，我们还提供了一种用于自动管理 MPS 资源以优化利用率和降低运营成本的解决方案：动态 MPS 分区。

GPU共享技术概述

共有三种共享 GPU 的方法：

时间分片
多实例 GPU (MIG)
多进程服务 (MPS)

在深入了解动态 MPS 分区的演示之前࿰

了解本专栏

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
如何使用 NVIDIA MPS 提高 Kubernetes 中的 GPU 利用率

时间分片多实例 GPU (MIG)多进程服务 (MPS)在深入了解动态 MPS 分区的演示之前，让我们先来概述一下这些技术。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

知识大胖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。