算力平台调研

前言

最近公司想租些GPU服务器使用,于是写了个简短的报告给老大看。因为公司使用对合规(要能开发票)和稳定有要求,还不希望太贵,所以最后挑了几家中小型平台。如果是个人使用也可以看看腾讯云这些大厂的抢占式GPU服务,也挺便宜的。

更新时间:2024.09.09

摘要

本次调研主要从定价、开票方式、显卡数量及种类、平台规模、易用性(文档、公用数据集的全面程度)五个维度进行考察。主要有以下结论:

  1. 大厂的服务器太贵,因此排除;各中小平台的定价相差不多;

  2. 继续从开票方式、显卡数量及种类、平台规模、易用性(文档、公用数据集的全面程度)四个维度考察,开票方式不符合要求及平台规模较小的直接排除。最终从14个平台中选取了恒源云 、AutoDL、openbayes三家作为备选,并进行了主观打分。

备选平台打分及参考价格

表1:备选平台主观打分(5分制)

型号恒源云AutoDLopenbayes
显卡数量及种类543
易用性(文档、公用数据集的全面程度)345

表2:备选平台参考价格(单位:元)

型号恒源云AutoDLopenbayes
RTX 4090
按量计费¥1.89/小时¥2.08/时¥2.70/时
包天¥43.09¥46.55不支持
包周¥295.29¥308.75不支持
包月¥1224.72¥1136.20不支持
V100-32G
按量计费¥3.00/小时¥1.98/时¥2.30/时
包天¥70.56¥45.60不支持
包周¥478.80¥290.70不支持
包月¥1944.00¥1138.10不支持
A100-40G
按量计费¥3.80/小时¥3.28/时¥9.00/时
包天¥89.38¥71.25不支持
包周¥606.48¥441.75不支持
包月¥2517.12¥1520.00不支持

考察维度说明

1. 定价(大平台vs小平台)

目前算力平台提供的GPU主要是消费级显卡GeForce系列,和高性能计算的Tesla系列。在参数相近、单卡工作的情况下,GeForce系列的显卡与Tesla表现近似,但是多卡协同时会有比较大的性能损失。

由于影响定价的因素较多,即便在同一平台上,同一型号的GPU也可能因服务器所在地域、配置(如CPU、内存、硬盘等)不同而出现价格差异。因此考察定价时选取了当下在深度学习领域普遍采用的三个型号——RTX 4090、A100-40G、V100-32G进行对比。

对比表明,大平台不提供消费级显卡的算力租赁;而对于同型号计算卡,按量计费的情况下,大平台的价格比小平台要贵数倍。因此可排除

表3:大型平台及中小型平台价格对比(按时计费,单位:元)

型号|平台恒源云AutoDLopenbayes智星云腾讯云阿里云
RTX 4090¥1.89/小时¥2.08/时¥2.70/时1.80
A100-40G¥3.80/小时¥3.28/时¥9.00/时2.4928.64
V100-32G¥3.00/小时¥1.98/时¥2.30/时1.6011.9819.739

2. 开票方式等(中小型平台)

要求开票金额应以充值金额计算,即,先付费开票、再慢慢用。发票内容不应为“充值”等。

公司规模以企查查等平台的参保人数、注册资本、成立日期的公开数据作为参考。

表4:目前存在的中小型算力平台开票方式及规模一览

表4.1:备选平台

发票内容发票类型金额其他公司参保人数注册资本成立日期
恒源云信息技术服务个人/企业/组织增值税普通发票已充值金额 - 已开具发票金额上海恒源云网络科技有限公司6252020-09-23
AutoDL默认*信息技术服务*云服务费,还可以开信息技术服务云服务器服务费、信息技术服务云服务器租赁服务费,此外不支持其他发票内容企业增值税普通发票、增值税专用发票、个人发票可根据消费账单开票,或根据充值金额开票视拓云(南京)科技有限公司61000w2022-06-30
openbayes*信息技术服务*云服务费根据充值记录和从支付宝等直接消费的记录开票贝式计算(天津)信息技术有限公司1273w2015

表4.2:因开票方式或计费方式不符合要求被排除的名单

发票内容发票类型开票金额其他公司参保人数注册资本成立日期
算力云(AnyGPU)根据消费金额开票
青云Cloud开票仅针对已消费金额,充值未消费部分无法开具发票。
亿速云不支持按时计费

表4.3:因显卡型号、数量较少被排除的名单

发票内容发票类型金额其他公司参保人数注册资本成立日期
UCloud软件服务费、硬件设备、其他数电增值税普通发票/专用发票充值未开票余额可提现,提现操作会体现在账户流水中优刻得科技股份有限公司38545,309w2012-03-16
智星云“信息技术服务高性能云计算服务”、“电信服务增值电信服务费”已充值金额 - 已开具发票金额上海亘聪信息科技有限公司151000w2019-08-30
FunHPC信息技术服务算力服务 或者 信息技术服务云计算服务数电发票 可以开具普票和专票无文档。发票金额按照充值到账的金额来算的郑州超级云计算有限公司81000w
OneThingAI电信服务*技术服务费电子普票,也可以开专票开票按照充值金额深圳前海网心网络技术有限公司1000w

注:UCloud虽然在中小型平台中规模相对较大,但其定价已接近腾讯阿里等大平台,因此不予考虑

表4.4:因平台规模较小而被排除的平台

发票内容发票类型金额其他公司参保人数注册资本成立日期
Featurize信息技术服务*云计算当前可开发票额度(已充值金额 - 已开具发票金额)成都费特瑞斯科技有限公司73002020-04-07
潞晨云信息技术服务*云服务费按充值金额或者消费金额开都可以北京潞晨科技有限公司17100w
算家云*信息技术服务*云服务器租赁服务费可开票金额= 总充值金额 – 已开票金额 - (账户金额 – 返现金额)贵州算家计算服务有限公司10w

附 GPU型号简介

分别摘自恒源云和AutuDL的用户文档。

NVIDIA常见的三大产品线如下

Quadro类型: Quadro系列显卡一般用于特定行业,比如设计、建筑等,图像处理专业显卡,比如CAD、Maya等软件。

GeForce类型: 这个系列显卡官方定位是消费级,常用来打游戏。但是它在深度学习上的表现也非常不错,很多人用来做推理、训练,单张卡的性能跟深度学习专业卡Tesla系列比起来其实差不太多,但是性价比却高很多。

Tesla类型: Tesla系列显卡定位并行计算,一般用于数据中心,具体点,比如用于深度学习,做训练、推理等。Tesla系列显卡针对GPU集群做了优化,像那种4卡、8卡、甚至16卡服务器,Tesla多块显卡合起来的性能不会受>很大影响,但是Geforce这种游戏卡性能损失严重,这也是Tesla主推并行计算的优势之一。

  • Quadro类型分为如下几个常见系列

NVIDIA RTX Series系列: RTX A2000、RTX A4000、RTX A4500、RTX A5000、RTX A6000

Quadro RTX Series系列: RTX 3000、RTX 4000、RTX 5000、RTX 6000、RTX 8000

  • GeForce类型分为如下几个常见系列

Geforce 10系列: GTX 1050、GTX 1050Ti、GTX 1060、GTX 1070、GTX 1070Ti、GTX 1080、GTX 1080Ti

Geforce 16系列:GTX 1650、GTX 1650 Super、GTX 1660、GTX 1660 Super、GTX 1660Ti

Geforce 20系列:RTX 2060、RTX 2060 Super、RTX 2070、RTX 2070 Super、RTX 2080、RTX 2080 Super、RTX 2080Ti

Geforce 30系列: RTX 3050、RTX 3060、RTX 3060Ti、RTX 3070、RTX 3070Ti、RTX 3080、RTX 3080Ti、RTX 3090 RTX 3090Ti

Geforce 40系列

  • Tesla类型分为如下几个常见系列

A-Series系列: A10、A16、A30、A40、A100

T-Series系列: T4

V-Series系列: V100

P-Series系列: P4、P6、P40、P100

K-Series系列: K8、K10、K20c、K20s、K20m、K20Xm、K40t、K40st、K40s、K40m、K40c、K520、K80

型号显存单精(FP32)半精(FP16)详细参数说明
Tesla P4024GB11.76 T11.76 T查看比较老的Pascal架构GPU,对于cuda11.x之前且对大显存有需求的算法是非常不错的选择
TITAN Xp12GB12.15 T12.15 T查看比较老的Pascal架构GPU,用作入门比较合适
1080 Ti11GB11.34 T11.34 T查看和TITANXp同时代的卡,同样适合入门,但是11GB的显存偶尔会比较尴尬
2080Ti11GB13.45 T53.8 T查看图灵架构GPU,性能还不错,老一代型号中比较适合做混合精度计算的GPU。性价比高
V10016/32GB15.7 T125 T查看老一代专业计算卡皇,半精性能高适合做混合精度计算
306012GB12.74 T约24T查看如果1080Ti的显存正好尴尬了,3060是不错的选择,适合新手。需要使用cuda11.x
A400016GB19.17 T约76T查看显存和算力都比较均衡,适合进阶过程使用。需要使用cuda11.x
3080Ti12GB34.10 T约70T查看性能钢炮,如果对显存要求不高则是非常合适的选择。需要使用cuda11.x
A500024GB27.77T约117T查看性能钢炮,如果觉得3080Ti的显存不够用A5000是合适的选择,并且半精算力高适合混合精度。需要使用cuda11.x
309024GB35.58 T约71T查看可以看做3080Ti的扩显存版。性能和显存大小都非常够用,适用性非常强,性价比首选。需要使用cuda11.x
A4048GB37.42 T149.7 T查看可以看做是3090的扩显存版。算力和3090基本持平,因此根据显存大小进行选择。需要使用cuda11.x
A100 SXM440/80GB19.5 T312 T查看新一代专业计算卡皇,除了贵没缺点。显存大,非常适合做半精计算,因为有NVLink加持,多卡并行加速比非常高。需要使用cuda11.x
409024G82.58 T165.2 T查看新一代游戏卡皇,除显存比较小和多机多卡并行效率低的缺点外,性价比非常高
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值