云卷云舒:“由云向算”的思考

        云计算技术已经发展了十几年,技术成熟度和商业模式已经被基本认可,云计算服务商从最开始的“亚马逊、阿里云”已经演变成为了“阿里云、华为云、腾讯云、天翼云、移动云、亚马逊云、京东云、美团云”等为主的“群雄割据”场面,阿里云市场份额超过40%,呈现了“一超多强”态势,近几年,随着国家对于“新基建、自主掌控”等工程的推进落地,以天翼云、移动云为代表的“云计算国家队”快速发展,已经进入“国内运服务商第一阵营”,市场占有率已经超过15%。

        未来云计算市场的发展格局,而“由云向算的转型”是传统云计算服务商未来几年的重心,行业内比较关注的还是智算中心建设、万卡GPU、算力并网等领域进展和话题,那么对于算力来讲,是当初销售基础算力(如GPU)、还是同步强化大模型服务、或基于算网的理念全面升级云产品服务体系?那么有谁在关注算力网络应用场景的研究呢?

一、人工智能领域重磅新进展

        近三年以来,世界人工智能领域的重磅成果有如下几个,我姑且做一下定位和分类(开发者的自身定位):

(1)chatGPT:人工智能大模型,通用大模型为主,从openAI在2020年推出chatGPT之后,国内外迅速跟进,目前“万模斗智”,各有各自的领域,包括相当部分的“行业大模型”,这部分已经不是瓶颈,只要你有行业数据、充足的算力。

(2)GPU:真可谓“一U难求”,从英伟达的A100、Tesla T4、A800、华为昇腾910B...国产化的各类卡;各类的卡算力整合架构、卡算力卸载玩法。单卡算力这一块我们和国外的差异还是很大。

(3)开始做整合了:算力网络的概念下,将人工智能卡连接起来是一个思路,力图通过整合提升整体算力供给能力上限,但是目前仅仅停留在“建设大规模算力资源池”阶段,目前国内比较大的几个算力资源池:

中国移动智算中心(哈尔滨):单集群内超过1.8万张AI加速卡,智能算力规模达6.9EFLOPS。

中贝合肥智算中心:安徽首家”低碳AI智算中心”,一期上线2200Flops@FP16算力已正式营运。

无锡·延安”智算中心:初步设计人工智能计算能力达到600P(FP16)规模,已建成并投产运营一期200P计算能力。

琶洲算谷·沙溪智算中心:粤港澳大湾区首个服务大模型的智算中心,搭载了华为最新款自研AI训练芯片昇腾910B,建成算力100P,计划两年内扩展到300P。

国家网安基地智算中心:总规划500PFLOPS算力,一期已建成投用125 PFLOPS算力。

中国雅云智算中心:总投资不低于5亿元,建设1024P的百舸算力中心。

中国移动智算中心(呼和浩特):部署约2万张AI加速卡,AI芯片国产化率超85%,智能算力规模高达6.7EFLOPS(每秒670亿亿次浮点运算)。

中国电信中部智算中心:首次采用基于国产AI基础软硬件平台的方案架构,可支持部署万亿参数大模型。

天府智算西南算力中心:支持GPU、FPGA、ASIC等多元AI加速芯片,将千亿参数大模型训练的算力效率提升至80%,相比传统数据中心节能提高25%以上。

中国移动算力中心北京节点:部署近4000张AI加速卡,AI芯片国产化率33%,智能算力规模超1000P,通信运营商在北京建成的首个大规模训推一体智算中心。

中国移动智算中心(青岛):首期投资超5.5亿元,智能算力规模达825PFlops。

华南数谷智算中心:总规模约3万个标准机柜(7000个算力机柜),项目预计建设16000P的异构算力池。

中国移动智算中心(武汉):已建成1500PFLOPS(1PFLOPS=每秒1千万亿次浮点运算)服务能力。

注:统计数据摘自互联网

类似于中国移动(移动云)这样的智算头部云商,都开始将万卡、2万卡资源池作为建设基点了,这个优势是越来越明显了,是传统的云计算和IT企业无法比拟的。可以说,他们已经赢了一半。

二、智算服务的主要模式

同时,我们也不难发现,算力基础设施大行其道,但在其服务模式依然相对传统。

服务模式服务内容潜在客户主要玩家
IDC的服务模式机房、安全、网络、服务器等大型互联网电信运营商、IDC提供商
算力销售租赁GPU(A100、国产化AI卡),以及配套的网络和存储能力AI研发企业云服务商
定制化项目制裸金属、GPU云主机地方政府、高校(XX大学智算中心)云服务商
一站式智算需求算力+大模型+行业解决方案行业客户(XX数字政府)集成商

 (1)IDC的服务模式:智算时代相比传统机房来说,侧重提升机房建设标准(电功率、绿色机房)、上线更快、资费模式转变为算力维度。

(2)算力销售/租赁:主要服务于大模型“训练和推理”,一般提供的训练卡会比较多,覆盖英威腾、华为等国产化卡。推理部分一般是T4、Atlas这些。以及华为昇腾的910B也可以提供训推一体服务。

(3)定制化项目:主要面向私有云场景,打包的方式提供给高校、地方政府等客户,提供以GPU云主机、裸金属为主。满足客户的定制化需求,可以提供不同类产品的上架。也包括定制一些门户、服务平台、测试环境等。

(4)一站式智算需求:与客户的应用侧,联动改造,提供智算服务商的产品能力融入、算力整合到场景中、甚至提供行业数据行业知识帮客户构建好AI应用,发挥价值。

其中云服务商在初期,一般都以第二种模式“算力销售租赁”来开展。

三、服务与生态的不足

根据上诉描述的云服务商的主要模式,依然以租赁“有智能属性”的算力产品为主,服务模式依然比较简单,短期内可以迅速满足广大AI客户对算力的需求,但是对于智算云服务商来讲,效益还是太饱了,自己的云产品如果不能快速向算网转型,很容易再次沦为管道。

具体来讲,就是服务与生态依然还是传统的模式,新型的产品供给和服务模式还没有充分释放,需要继续探索和努力。由云向算的转型,需要快速推进以智算为代表的算力网络模式转变。

---------时间关系,本章暂时分析到这,过两天空了展开讲讲我的思路。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cloud云卷云舒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值