docker用gpu的参数_【AI算力】GPU虚拟化技术对比: vGPU、cGPU和vCUDA

本文介绍了在AI应用场景中如何利用GPU虚拟化技术提高资源利用率,重点对比了cGPU和vCUDA两种方案。cGPU通过内核虚拟化实现GPU隔离,支持按权重抢占调度;vCUDA则修改CUDA库实现资源控制,可能存在兼容性问题,但具备开源优势。
摘要由CSDN通过智能技术生成

9def16514da259ae74bdb42a7450bd51.png

背景

AI落地时,在某些场景下AI模型在训练或者是推理时,其算力要求不需要占用整卡的GPU,比如只需要0.5卡GPU即可满足需求。在这种情况下,可以使用GPU虚拟化技术来解决这个问题,将整卡的GPU虚拟化为两个0.5卡的GPU,这样就可以在一张卡上同时跑两个AI训练或者AI推理应用服务,极大压榨算力资源,降低成本。
基本痛点:

  • 容器的GPU利用率不够高,特别是推理任务;
  • 为了提高GPU的利用率、避免算力浪费,需要在单个GPU上运行多个容器;

虚拟化技术对比

目前常见的NVIDIA GPU虚拟化技术方案有:NVIDIA GRID(vGPU),NVIDIA MPS,cGPU和vCUDA。其中,在k8s容器上常用的为vCUDA和cGPU方案:

85ad8612a6b72b4a1b4c449fbfed09d4.png
坑呀,我不想用图片的,但是直接markdown转不了知乎的表格,有点奇怪...被迫贴图片
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值