据报道,英伟达正在为中国市场研发一款名为“B30”的降规版AI芯片,这款芯片将首度支持多GPU扩展,允许用户通过连接多组芯片来打造更高性能的计算集群。
B30芯片预计将采用最新的Blackwell架构,使用GDDR7显存,而非高频宽内存(HBM),也不会采用台积电的先进封装技术。
英伟达B30快速集群搭建
B30单卡性能虽不及H20,却能通过堆叠数量实现集群算力提升。
据了解字节跳动、腾讯等互联网巨头已释放测试意向。在训练千亿参数模型的场景中,100块B30组成的集群理论性能可达H20集群的85%,但采购成本仅需60%。但对于需要单卡高带宽的垂直领域模型训练,B30的显存带宽却缩水至H20的45%。
英伟达B30价格卡位战术
B30售价预计在6500美元至8000美元之间,低于1万至1.2万美元的H20芯片,又高于部分国产芯片,适合预算有限但需要中等算力的企业。
英伟达B30应用场景细分
适用场景:分布式训练千亿参数模型(如互联网大厂的通用模型训练)、对单卡带宽要求不高的推理任务(如文本生成、客服机器人)。
B30芯片作为降规版,单芯片算力可能低于H20,但通过多GPU扩展可提升整体性能,适合对成本敏感但需要一定扩展性的应用场景。
此次B30芯片正是英伟达为中国市场定制的降规版 AI 芯片,虽然舍弃高端 HBM 显存,导致单卡显存带宽缩水。但是支持多 GPU 集群部署,且深度兼容 CUDA-X 软件栈,可无缝迁移主流深度学习框架(如 PyTorch、TensorFlow),降低企业技术适配成本。
企业定制化算力服务
对于有算力需求的中小企业来说,直接采购一套高性能的算力服务器,并持续维护和升级成本高昂,反而限制了企业在算力领域的投入。
为帮助企业突破传统算力在成本、效率、灵活性和适用性等方面的瓶颈,加速以智能化场景为核心的业务融合进程。万云智算在国内布局五大自运营算力中心,从算效提升、标准化管理、一体化服务等方面构建丰富、高效、易用、性价高的企业级定制算力服务。
万云智算覆盖主流算力A30、A800、H20、H800、4090等,为用户提供高性价比、自主可控、即开即用的GPU算力资源服务与定制化大模型服务。
NO.1
构建全域算力网
万云智算通过API直连东数西算节点、京津冀、长三角等10大核心区域,超50个机房,将分散的CPU、GPU、存储等资源整合为“算力资源池”,并通过智能调度引擎实现毫秒级匹配。
NO.2
建立标准化AI交付
通过为 AI 模型提供全面的数据支持,搭配低代码工具、自动化组件,最终让AI交付变为 “可快速复用的工具”,推动千行百业智能化转型。
NO.3
算力与AI深度融合
万云智算通过“算力资源+AI平台+场景化工具” 的一体化方案,将算力基础与AI开发服务一体化,实现“资源即服务”。
NO.4
行业定制解决方案
利用领域专家经验与企业历史数据,构建企业知识库。并根据特定业务场景和需求进行大模型训练和优化,精准解决企业实际问题,实现业务模式创新。
万云智算致力于提供高效、稳定、安全的企业定制化算力服务,助力企业快速驶入AI时代。无论是尝试AI转型的传统企业,还是需要大规模私有化部署的领军企业,万云智算都将提供行业解决方案,帮助企业实现智能化转型升级。