VGPU的使用

(作者:陈玓玏)


开源项目,欢迎star哦,https://github.com/data-infra/cube-studio

训练AI模型以及部署模型推理服务时,GPU往往是必不可少的,但当我们机器上没有足够的GPU卡可使用时,多任务并行就会有困难。针对这个问题,cube-studio上可以使用VGPU,相当于将一张GPU卡当成多张来使用,从而实现多卡多应用占用。

以下我们举例说明,如何通过VGPU配置,实现推理服务的VGPU占用。

1. 进入训练平台

体验环境可以直接使用,也可以根据https://github.com/data-infra/cube-studio/wiki来部署之后使用。

2. 配置VGPU

选择一个已经部署好的推理服务(有模型接口即可)。

  1. “服务化”-“推理服务”-“更多”-“修改”,修改推理服务的GPU申请为0.1、最大最小副本数为3,修改确认后,推理服务信息如下;
    在这里插入图片描述

  2. 点击服务的“部署生产”,部署服务,并点击模型名称链接查看其pod,可以看到同一服务的3个pod是在同一台机器上;

在这里插入图片描述

  1. “服务化”-“整体资源”,可看到机器仅1张GPU卡,目前占用0.3张。

在这里插入图片描述

以上可证明该推理服务以VGPU模式占用了GPU卡。

  • 6
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值