算力平台调研_算力调度平台分析报告-CSDN博客

本文链接：https://blog.csdn.net/catquantum/article/details/143394848

前言

最近公司想租些GPU服务器使用，于是写了个简短的报告给老大看。因为公司使用对合规（要能开发票）和稳定有要求，还不希望太贵，所以最后挑了几家中小型平台。如果是个人使用也可以看看腾讯云这些大厂的抢占式GPU服务，也挺便宜的。

更新时间：2024.09.09

摘要

本次调研主要从定价、开票方式、显卡数量及种类、平台规模、易用性（文档、公用数据集的全面程度）五个维度进行考察。主要有以下结论：

大厂的服务器太贵，因此排除；各中小平台的定价相差不多；
继续从开票方式、显卡数量及种类、平台规模、易用性（文档、公用数据集的全面程度）四个维度考察，开票方式不符合要求及平台规模较小的直接排除。最终从14个平台中选取了恒源云、AutoDL、openbayes三家作为备选，并进行了主观打分。

备选平台打分及参考价格

表1：备选平台主观打分（5分制）

型号	恒源云	AutoDL	openbayes
显卡数量及种类	5	4	3
易用性（文档、公用数据集的全面程度）	3	4	5

表2：备选平台参考价格（单位：元）

型号	恒源云	AutoDL	openbayes
RTX 4090
按量计费	￥1.89/小时	￥2.08/时	￥2.70/时
包天	￥43.09	￥46.55	不支持
包周	￥295.29	￥308.75	不支持
包月	￥1224.72	￥1136.20	不支持
V100-32G
按量计费	￥3.00/小时	￥1.98/时	￥2.30/时
包天	￥70.56	￥45.60	不支持
包周	￥478.80	￥290.70	不支持
包月	￥1944.00	￥1138.10	不支持
A100-40G
按量计费	￥3.80/小时	￥3.28/时	￥9.00/时
包天	￥89.38	￥71.25	不支持
包周	￥606.48	￥441.75	不支持
包月	￥2517.12	￥1520.00	不支持

考察维度说明

1. 定价（大平台vs小平台）

目前算力平台提供的GPU主要是消费级显卡GeForce系列，和高性能计算的Tesla系列。在参数相近、单卡工作的情况下，GeForce系列的显卡与Tesla表现近似，但是多卡协同时会有比较大的性能损失。

由于影响定价的因素较多，即便在同一平台上，同一型号的GPU也可能因服务器所在地域、配置（如CPU、内存、硬盘等）不同而出现价格差异。因此考察定价时选取了当下在深度学习领域普遍采用的三个型号——RTX 4090、A100-40G、V100-32G进行对比。

对比表明，大平台不提供消费级显卡的算力租赁；而对于同型号计算卡，按量计费的情况下，大平台的价格比小平台要贵数倍。因此可排除

表3：大型平台及中小型平台价格对比（按时计费，单位：元）

型号\|平台	恒源云	AutoDL	openbayes	智星云	腾讯云	阿里云
RTX 4090	￥1.89/小时	￥2.08/时	￥2.70/时	1.80	无	无
A100-40G	￥3.80/小时	￥3.28/时	￥9.00/时	2.49	28.64	无
V100-32G	￥3.00/小时	￥1.98/时	￥2.30/时	1.60	11.98	19.739

2. 开票方式等（中小型平台）

要求开票金额应以充值金额计算，即，先付费开票、再慢慢用。发票内容不应为“充值”等。

公司规模以企查查等平台的参保人数、注册资本、成立日期的公开数据作为参考。

表4：目前存在的中小型算力平台开票方式及规模一览

表4.1：备选平台

	发票内容	发票类型	金额	公司	参保人数	注册资本	成立日期
恒源云	信息技术服务	个人/企业/组织增值税普通发票	已充值金额 - 已开具发票金额	上海恒源云网络科技有限公司		625	2020-09-23
AutoDL	默认信息技术服务云服务费，还可以开信息技术服务云服务器服务费、信息技术服务云服务器租赁服务费，此外不支持其他发票内容	企业增值税普通发票、增值税专用发票、个人发票	可根据消费账单开票，或根据充值金额开票。	视拓云（南京）科技有限公司	6	1000w	2022-06-30
openbayes	信息技术服务云服务费		根据充值记录和从支付宝等直接消费的记录开票	贝式计算（天津）信息技术有限公司		1273w	2015

表4.2：因开票方式或计费方式不符合要求被排除的名单

	开票金额	其他
算力云（AnyGPU）	根据消费金额开票
青云Cloud	开票仅针对已消费金额，充值未消费部分无法开具发票。
亿速云		不支持按时计费

表4.3：因显卡型号、数量较少被排除的名单

	发票内容	发票类型	金额	其他	公司	参保人数	注册资本	成立日期
UCloud	软件服务费、硬件设备、其他	数电增值税普通发票/专用发票	充值	未开票余额可提现，提现操作会体现在账户流水中	优刻得科技股份有限公司	385	45,309w	2012-03-16
智星云	“信息技术服务高性能云计算服务”、“电信服务增值电信服务费”		已充值金额 - 已开具发票金额		上海亘聪信息科技有限公司	15	1000w	2019-08-30
FunHPC	信息技术服务算力服务或者信息技术服务云计算服务	数电发票可以开具普票和专票	无文档。发票金额按照充值到账的金额来算的		郑州超级云计算有限公司	8	1000w
OneThingAI	电信服务*技术服务费	电子普票，也可以开专票	开票按照充值金额		深圳前海网心网络技术有限公司		1000w

注：UCloud虽然在中小型平台中规模相对较大，但其定价已接近腾讯阿里等大平台，因此不予考虑

表4.4：因平台规模较小而被排除的平台

	发票内容	金额	公司	参保人数	注册资本	成立日期
Featurize	信息技术服务*云计算	当前可开发票额度（已充值金额 - 已开具发票金额）	成都费特瑞斯科技有限公司	7	300	2020-04-07
潞晨云	信息技术服务*云服务费	按充值金额或者消费金额开都可以	北京潞晨科技有限公司	17	100w
算家云	信息技术服务云服务器租赁服务费	可开票金额= 总充值金额 – 已开票金额 - （账户金额 – 返现金额）	贵州算家计算服务有限公司		10w

附 GPU型号简介

分别摘自恒源云和AutuDL的用户文档。

NVIDIA常见的三大产品线如下

Quadro类型: Quadro系列显卡一般用于特定行业，比如设计、建筑等，图像处理专业显卡，比如CAD、Maya等软件。

GeForce类型: 这个系列显卡官方定位是消费级，常用来打游戏。但是它在深度学习上的表现也非常不错，很多人用来做推理、训练，单张卡的性能跟深度学习专业卡Tesla系列比起来其实差不太多，但是性价比却高很多。

Tesla类型: Tesla系列显卡定位并行计算，一般用于数据中心，具体点，比如用于深度学习，做训练、推理等。Tesla系列显卡针对GPU集群做了优化，像那种4卡、8卡、甚至16卡服务器，Tesla多块显卡合起来的性能不会受>很大影响，但是Geforce这种游戏卡性能损失严重，这也是Tesla主推并行计算的优势之一。

Quadro类型分为如下几个常见系列

NVIDIA RTX Series系列: RTX A2000、RTX A4000、RTX A4500、RTX A5000、RTX A6000

Quadro RTX Series系列: RTX 3000、RTX 4000、RTX 5000、RTX 6000、RTX 8000

GeForce类型分为如下几个常见系列

Geforce 10系列: GTX 1050、GTX 1050Ti、GTX 1060、GTX 1070、GTX 1070Ti、GTX 1080、GTX 1080Ti

Geforce 16系列：GTX 1650、GTX 1650 Super、GTX 1660、GTX 1660 Super、GTX 1660Ti

Geforce 20系列：RTX 2060、RTX 2060 Super、RTX 2070、RTX 2070 Super、RTX 2080、RTX 2080 Super、RTX 2080Ti

Geforce 30系列: RTX 3050、RTX 3060、RTX 3060Ti、RTX 3070、RTX 3070Ti、RTX 3080、RTX 3080Ti、RTX 3090 RTX 3090Ti

Geforce 40系列

Tesla类型分为如下几个常见系列

A-Series系列: A10、A16、A30、A40、A100

T-Series系列: T4

V-Series系列: V100

P-Series系列: P4、P6、P40、P100

K-Series系列: K8、K10、K20c、K20s、K20m、K20Xm、K40t、K40st、K40s、K40m、K40c、K520、K80

型号	显存	单精(FP32)	半精(FP16)	详细参数	说明
Tesla P40	24GB	11.76 T	11.76 T	查看	比较老的Pascal架构GPU，对于cuda11.x之前且对大显存有需求的算法是非常不错的选择
TITAN Xp	12GB	12.15 T	12.15 T	查看	比较老的Pascal架构GPU，用作入门比较合适
1080 Ti	11GB	11.34 T	11.34 T	查看	和TITANXp同时代的卡，同样适合入门，但是11GB的显存偶尔会比较尴尬
2080Ti	11GB	13.45 T	53.8 T	查看	图灵架构GPU，性能还不错，老一代型号中比较适合做混合精度计算的GPU。性价比高
V100	16/32GB	15.7 T	125 T	查看	老一代专业计算卡皇，半精性能高适合做混合精度计算
3060	12GB	12.74 T	约24T	查看	如果1080Ti的显存正好尴尬了，3060是不错的选择，适合新手。需要使用cuda11.x
A4000	16GB	19.17 T	约76T	查看	显存和算力都比较均衡，适合进阶过程使用。需要使用cuda11.x
3080Ti	12GB	34.10 T	约70T	查看	性能钢炮，如果对显存要求不高则是非常合适的选择。需要使用cuda11.x
A5000	24GB	27.77T	约117T	查看	性能钢炮，如果觉得3080Ti的显存不够用A5000是合适的选择，并且半精算力高适合混合精度。需要使用cuda11.x
3090	24GB	35.58 T	约71T	查看	可以看做3080Ti的扩显存版。性能和显存大小都非常够用，适用性非常强，性价比首选。需要使用cuda11.x
A40	48GB	37.42 T	149.7 T	查看	可以看做是3090的扩显存版。算力和3090基本持平，因此根据显存大小进行选择。需要使用cuda11.x
A100 SXM4	40/80GB	19.5 T	312 T	查看	新一代专业计算卡皇，除了贵没缺点。显存大，非常适合做半精计算，因为有NVLink加持，多卡并行加速比非常高。需要使用cuda11.x
4090	24G	82.58 T	165.2 T	查看	新一代游戏卡皇，除显存比较小和多机多卡并行效率低的缺点外，性价比非常高