首度支持多GPU扩展！成本骤降33%！英伟达B30芯片破解算力限制

万云智算

于 2025-06-05 18:01:48 发布

阅读量461

点赞数 9

文章标签：人工智能 AI

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_61428015/article/details/148456197

版权

据报道，英伟达正在为中国市场研发一款名为“B30”的降规版AI芯片，这款芯片将首度支持多GPU扩展，允许用户通过连接多组芯片来打造更高性能的计算集群。

B30芯片预计将采用最新的Blackwell架构，使用GDDR7显存，而非高频宽内存（HBM），也不会采用台积电的先进封装技术。

英伟达B30快速集群搭建

B30单卡性能虽不及H20，却能通过堆叠数量实现集群算力提升。

据了解字节跳动、腾讯等互联网巨头已释放测试意向。在训练千亿参数模型的场景中，100块B30组成的集群理论性能可达H20集群的85%，但采购成本仅需60%。但对于需要单卡高带宽的垂直领域模型训练，B30的显存带宽却缩水至H20的45%。

英伟达B30价格卡位战术

B30售价预计在6500美元至8000美元之间，低于1万至1.2万美元的H20芯片，又高于部分国产芯片，适合预算有限但需要中等算力的企业。

英伟达B30应用场景细分

适用场景：分布式训练千亿参数模型（如互联网大厂的通用模型训练）、对单卡带宽要求不高的推理任务（如文本生成、客服机器人）。

B30芯片作为降规版，单芯片算力可能低于H20，但通过多GPU扩展可提升整体性能，适合对成本敏感但需要一定扩展性的应用场景。

此次B30芯片正是英伟达为中国市场定制的降规版 AI 芯片，虽然舍弃高端 HBM 显存，导致单卡显存带宽缩水。但是支持多 GPU 集群部署，且深度兼容 CUDA-X 软件栈，可无缝迁移主流深度学习框架（如 PyTorch、TensorFlow），降低企业技术适配成本。

企业定制化算力服务

对于有算力需求的中小企业来说，直接采购一套高性能的算力服务器，并持续维护和升级成本高昂，反而限制了企业在算力领域的投入。

为帮助企业突破传统算力在成本、效率、灵活性和适用性等方面的瓶颈，加速以智能化场景为核心的业务融合进程。万云智算在国内布局五大自运营算力中心，从算效提升、标准化管理、一体化服务等方面构建丰富、高效、易用、性价高的企业级定制算力服务。

万云智算覆盖主流算力A30、A800、H20、H800、4090等，为用户提供高性价比、自主可控、即开即用的GPU算力资源服务与定制化大模型服务。

点击获取企业定制化行业解决方案

NO.1

构建全域算力网

万云智算通过API直连东数西算节点、京津冀、长三角等10大核心区域，超50个机房，将分散的CPU、GPU、存储等资源整合为“算力资源池”，并通过智能调度引擎实现毫秒级匹配。

NO.2

建立标准化AI交付

通过为 AI 模型提供全面的数据支持，搭配低代码工具、自动化组件，最终让AI交付变为 “可快速复用的工具”，推动千行百业智能化转型。

NO.3

算力与AI深度融合

万云智算通过“算力资源+AI平台+场景化工具” 的一体化方案，将算力基础与AI开发服务一体化，实现“资源即服务”。

NO.4

行业定制解决方案

利用领域专家经验与企业历史数据，构建企业知识库。并根据特定业务场景和需求进行大模型训练和优化，精准解决企业实际问题，实现业务模式创新。

万云智算致力于提供高效、稳定、安全的企业定制化算力服务，助力企业快速驶入AI时代。无论是尝试AI转型的传统企业，还是需要大规模私有化部署的领军企业，万云智算都将提供行业解决方案，帮助企业实现智能化转型升级。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。