前言
最近公司想租些GPU服务器使用,于是写了个简短的报告给老大看。因为公司使用对合规(要能开发票)和稳定有要求,还不希望太贵,所以最后挑了几家中小型平台。如果是个人使用也可以看看腾讯云这些大厂的抢占式GPU服务,也挺便宜的。
更新时间:2024.09.09
摘要
本次调研主要从定价、开票方式、显卡数量及种类、平台规模、易用性(文档、公用数据集的全面程度)五个维度进行考察。主要有以下结论:
-
大厂的服务器太贵,因此排除;各中小平台的定价相差不多;
-
继续从开票方式、显卡数量及种类、平台规模、易用性(文档、公用数据集的全面程度)四个维度考察,开票方式不符合要求及平台规模较小的直接排除。最终从14个平台中选取了恒源云 、AutoDL、openbayes三家作为备选,并进行了主观打分。
备选平台打分及参考价格
表1:备选平台主观打分(5分制)
型号 | 恒源云 | AutoDL | openbayes |
---|---|---|---|
显卡数量及种类 | 5 | 4 | 3 |
易用性(文档、公用数据集的全面程度) | 3 | 4 | 5 |
表2:备选平台参考价格(单位:元)
型号 | 恒源云 | AutoDL | openbayes |
---|---|---|---|
RTX 4090 | |||
按量计费 | ¥1.89/小时 | ¥2.08/时 | ¥2.70/时 |
包天 | ¥43.09 | ¥46.55 | 不支持 |
包周 | ¥295.29 | ¥308.75 | 不支持 |
包月 | ¥1224.72 | ¥1136.20 | 不支持 |
V100-32G | |||
按量计费 | ¥3.00/小时 | ¥1.98/时 | ¥2.30/时 |
包天 | ¥70.56 | ¥45.60 | 不支持 |
包周 | ¥478.80 | ¥290.70 | 不支持 |
包月 | ¥1944.00 | ¥1138.10 | 不支持 |
A100-40G | |||
按量计费 | ¥3.80/小时 | ¥3.28/时 | ¥9.00/时 |
包天 | ¥89.38 | ¥71.25 | 不支持 |
包周 | ¥606.48 | ¥441.75 | 不支持 |
包月 | ¥2517.12 | ¥1520.00 | 不支持 |
考察维度说明
1. 定价(大平台vs小平台)
目前算力平台提供的GPU主要是消费级显卡GeForce系列,和高性能计算的Tesla系列。在参数相近、单卡工作的情况下,GeForce系列的显卡与Tesla表现近似,但是多卡协同时会有比较大的性能损失。
由于影响定价的因素较多,即便在同一平台上,同一型号的GPU也可能因服务器所在地域、配置(如CPU、内存、硬盘等)不同而出现价格差异。因此考察定价时选取了当下在深度学习领域普遍采用的三个型号——RTX 4090、A100-40G、V100-32G进行对比。
对比表明,大平台不提供消费级显卡的算力租赁;而对于同型号计算卡,按量计费的情况下,大平台的价格比小平台要贵数倍。因此可排除
表3:大型平台及中小型平台价格对比(按时计费,单位:元)
型号|平台 | 恒源云 | AutoDL | openbayes | 智星云 | 腾讯云 | 阿里云 |
---|---|---|---|---|---|---|
RTX 4090 | ¥1.89/小时 | ¥2.08/时 | ¥2.70/时 | 1.80 | 无 | 无 |
A100-40G | ¥3.80/小时 | ¥3.28/时 | ¥9.00/时 | 2.49 | 28.64 | 无 |
V100-32G | ¥3.00/小时 | ¥1.98/时 | ¥2.30/时 | 1.60 | 11.98 | 19.739 |
2. 开票方式等(中小型平台)
要求开票金额应以充值金额计算,即,先付费开票、再慢慢用。发票内容不应为“充值”等。
公司规模以企查查等平台的参保人数、注册资本、成立日期的公开数据作为参考。
表4:目前存在的中小型算力平台开票方式及规模一览
表4.1:备选平台
发票内容 | 发票类型 | 金额 | 其他 | 公司 | 参保人数 | 注册资本 | 成立日期 | |
---|---|---|---|---|---|---|---|---|
恒源云 | 信息技术服务 | 个人/企业/组织增值税普通发票 | 已充值金额 - 已开具发票金额 | 上海恒源云网络科技有限公司 | 625 | 2020-09-23 | ||
AutoDL | 默认*信息技术服务*云服务费,还可以开信息技术服务云服务器服务费、信息技术服务云服务器租赁服务费,此外不支持其他发票内容 | 企业增值税普通发票、增值税专用发票、个人发票 | 可根据消费账单开票,或根据充值金额开票。 | 视拓云(南京)科技有限公司 | 6 | 1000w | 2022-06-30 | |
openbayes | *信息技术服务*云服务费 | 根据充值记录和从支付宝等直接消费的记录开票 | 贝式计算(天津)信息技术有限公司 | 1273w | 2015 |
表4.2:因开票方式或计费方式不符合要求被排除的名单
发票内容 | 发票类型 | 开票金额 | 其他 | 公司 | 参保人数 | 注册资本 | 成立日期 | |
---|---|---|---|---|---|---|---|---|
算力云(AnyGPU) | 根据消费金额开票 | |||||||
青云Cloud | 开票仅针对已消费金额,充值未消费部分无法开具发票。 | |||||||
亿速云 | 不支持按时计费 |
表4.3:因显卡型号、数量较少被排除的名单
发票内容 | 发票类型 | 金额 | 其他 | 公司 | 参保人数 | 注册资本 | 成立日期 | |
---|---|---|---|---|---|---|---|---|
UCloud | 软件服务费、硬件设备、其他 | 数电增值税普通发票/专用发票 | 充值 | 未开票余额可提现,提现操作会体现在账户流水中 | 优刻得科技股份有限公司 | 385 | 45,309w | 2012-03-16 |
智星云 | “信息技术服务高性能云计算服务”、“电信服务增值电信服务费” | 已充值金额 - 已开具发票金额 | 上海亘聪信息科技有限公司 | 15 | 1000w | 2019-08-30 | ||
FunHPC | 信息技术服务算力服务 或者 信息技术服务云计算服务 | 数电发票 可以开具普票和专票 | 无文档。发票金额按照充值到账的金额来算的 | 郑州超级云计算有限公司 | 8 | 1000w | ||
OneThingAI | 电信服务*技术服务费 | 电子普票,也可以开专票 | 开票按照充值金额 | 深圳前海网心网络技术有限公司 | 1000w |
注:UCloud虽然在中小型平台中规模相对较大,但其定价已接近腾讯阿里等大平台,因此不予考虑
表4.4:因平台规模较小而被排除的平台
发票内容 | 发票类型 | 金额 | 其他 | 公司 | 参保人数 | 注册资本 | 成立日期 | |
---|---|---|---|---|---|---|---|---|
Featurize | 信息技术服务*云计算 | 当前可开发票额度(已充值金额 - 已开具发票金额) | 成都费特瑞斯科技有限公司 | 7 | 300 | 2020-04-07 | ||
潞晨云 | 信息技术服务*云服务费 | 按充值金额或者消费金额开都可以 | 北京潞晨科技有限公司 | 17 | 100w | |||
算家云 | *信息技术服务*云服务器租赁服务费 | 可开票金额= 总充值金额 – 已开票金额 - (账户金额 – 返现金额) | 贵州算家计算服务有限公司 | 10w |
附 GPU型号简介
分别摘自恒源云和AutuDL的用户文档。
NVIDIA常见的三大产品线如下
Quadro类型: Quadro系列显卡一般用于特定行业,比如设计、建筑等,图像处理专业显卡,比如CAD、Maya等软件。
GeForce类型: 这个系列显卡官方定位是消费级,常用来打游戏。但是它在深度学习上的表现也非常不错,很多人用来做推理、训练,单张卡的性能跟深度学习专业卡Tesla系列比起来其实差不太多,但是性价比却高很多。
Tesla类型: Tesla系列显卡定位并行计算,一般用于数据中心,具体点,比如用于深度学习,做训练、推理等。Tesla系列显卡针对GPU集群做了优化,像那种4卡、8卡、甚至16卡服务器,Tesla多块显卡合起来的性能不会受>很大影响,但是Geforce这种游戏卡性能损失严重,这也是Tesla主推并行计算的优势之一。
Quadro类型分为如下几个常见系列
NVIDIA RTX Series系列: RTX A2000、RTX A4000、RTX A4500、RTX A5000、RTX A6000
Quadro RTX Series系列: RTX 3000、RTX 4000、RTX 5000、RTX 6000、RTX 8000
GeForce类型分为如下几个常见系列
Geforce 10系列: GTX 1050、GTX 1050Ti、GTX 1060、GTX 1070、GTX 1070Ti、GTX 1080、GTX 1080Ti
Geforce 16系列:GTX 1650、GTX 1650 Super、GTX 1660、GTX 1660 Super、GTX 1660Ti
Geforce 20系列:RTX 2060、RTX 2060 Super、RTX 2070、RTX 2070 Super、RTX 2080、RTX 2080 Super、RTX 2080Ti
Geforce 30系列: RTX 3050、RTX 3060、RTX 3060Ti、RTX 3070、RTX 3070Ti、RTX 3080、RTX 3080Ti、RTX 3090 RTX 3090Ti
Geforce 40系列
Tesla类型分为如下几个常见系列
A-Series系列: A10、A16、A30、A40、A100
T-Series系列: T4
V-Series系列: V100
P-Series系列: P4、P6、P40、P100
K-Series系列: K8、K10、K20c、K20s、K20m、K20Xm、K40t、K40st、K40s、K40m、K40c、K520、K80
型号 | 显存 | 单精(FP32) | 半精(FP16) | 详细参数 | 说明 |
---|---|---|---|---|---|
Tesla P40 | 24GB | 11.76 T | 11.76 T | 查看 | 比较老的Pascal架构GPU,对于cuda11.x之前且对大显存有需求的算法是非常不错的选择 |
TITAN Xp | 12GB | 12.15 T | 12.15 T | 查看 | 比较老的Pascal架构GPU,用作入门比较合适 |
1080 Ti | 11GB | 11.34 T | 11.34 T | 查看 | 和TITANXp同时代的卡,同样适合入门,但是11GB的显存偶尔会比较尴尬 |
2080Ti | 11GB | 13.45 T | 53.8 T | 查看 | 图灵架构GPU,性能还不错,老一代型号中比较适合做混合精度计算的GPU。性价比高 |
V100 | 16/32GB | 15.7 T | 125 T | 查看 | 老一代专业计算卡皇,半精性能高适合做混合精度计算 |
3060 | 12GB | 12.74 T | 约24T | 查看 | 如果1080Ti的显存正好尴尬了,3060是不错的选择,适合新手。需要使用cuda11.x |
A4000 | 16GB | 19.17 T | 约76T | 查看 | 显存和算力都比较均衡,适合进阶过程使用。需要使用cuda11.x |
3080Ti | 12GB | 34.10 T | 约70T | 查看 | 性能钢炮,如果对显存要求不高则是非常合适的选择。需要使用cuda11.x |
A5000 | 24GB | 27.77T | 约117T | 查看 | 性能钢炮,如果觉得3080Ti的显存不够用A5000是合适的选择,并且半精算力高适合混合精度。需要使用cuda11.x |
3090 | 24GB | 35.58 T | 约71T | 查看 | 可以看做3080Ti的扩显存版。性能和显存大小都非常够用,适用性非常强,性价比首选。需要使用cuda11.x |
A40 | 48GB | 37.42 T | 149.7 T | 查看 | 可以看做是3090的扩显存版。算力和3090基本持平,因此根据显存大小进行选择。需要使用cuda11.x |
A100 SXM4 | 40/80GB | 19.5 T | 312 T | 查看 | 新一代专业计算卡皇,除了贵没缺点。显存大,非常适合做半精计算,因为有NVLink加持,多卡并行加速比非常高。需要使用cuda11.x |
4090 | 24G | 82.58 T | 165.2 T | 查看 | 新一代游戏卡皇,除显存比较小和多机多卡并行效率低的缺点外,性价比非常高 |