
GPU智算
文章平均质量分 95
古猫先生
长期混迹存储领域,先后供职于知名半导体外企和互联网存储研发,欢迎留言or私信交流~
展开
-
字节跳动GPU Scale-up互联技术白皮书
摘要: 随着AI模型复杂度提升,GPU集群互联面临带宽与延迟的双重挑战。传统Scale-up网络(如PCIe/NVLINK)难以满足大模型训练需求,而以太网凭借高带宽、低成本及持续迭代优势成为新方向。字节跳动提出自研EthLink方案,融合Load/Store与RDMA语义,支持小块控制数据与大块模型数据的差异化传输,并通过协议优化实现低延迟、高扩展性。方案覆盖机内与跨机互联,突破传统硬件一致性限制,由软件管理缓存同步,适配AI训练的计算-传输流水需求。EthLink基于以太网生态,兼具性能与成本优势,为超原创 2025-05-25 23:29:49 · 1133 阅读 · 0 评论 -
漫谈英伟达GPU架构进化史:从Celsius到Blackwell
英伟达GPU架构演进史(1999-2024) 本文梳理了英伟达从1999年Celsius架构到2024年Blackwell架构的20多代技术发展历程。1999年GeForce256首次提出GPU概念,开启图形处理器独立计算时代;2006年Tesla架构引入统一渲染和CUDA核心,开创GPU通用计算新纪元;2017年Volta架构加入Tensor Core,推动AI计算革命;2020年Ampere架构实现数据中心性能飞跃;2024年Blackwell架构专为生成式AI优化,支持万亿参数模型。每一代架构都在制程原创 2025-05-25 21:51:55 · 1471 阅读 · 0 评论