GPU的最佳拍档HBM到底是什么

Gooxi国鑫

已于 2024-06-05 09:30:56 修改

阅读量979

点赞数 5

文章标签：人工智能

于 2024-06-03 10:44:59 首次发布

本文链接：https://blog.csdn.net/gooxi_hui/article/details/139408685

版权

在AI界，英伟达的大名无人不知，无人不晓。然而即使在AI芯片界占据绝对霸主地位的英伟达，依旧受制于人。

众所周知，算力与带宽是制衡AI应用的两大关键因素，长期以来高速发展的算力受困于有限的带宽限制了其性能的最大发挥。

而带宽往往取决于芯片的性能，因而采用了先进封装从而克服高性能计算应用程序的内存访问障碍的HBM应运而生。作为一种新兴的高带宽内存，它几乎成为了AI芯片的必备搭档。

HBM到底什么来头？

那么何为HBM呢？它是High Bandwidth Memory的缩写，即一种新型的高带宽存储器，通过采用硅通孔（TSV）和微凸块（Microbump）等先进封装方法将各个芯片相互连接，形成一个整体的高带宽内存模块。

简而言之，它改变了常规的DDR（Double Data Rate） 2D平面的堆叠方式而更换成为密度更高的3D立体堆叠技术，它的突破在于在较小的物理空间里实现了大容量、高位宽的DR组合阵列，因此HBM具有更高带宽、更多I/O数量、更低功耗、更小尺寸，同时意味着这将不可避免造成了一定数据延迟以及它的不可扩展性。

AI和高性能领域几乎都是可预测的高并发任务，对于GPU的延迟要求相对不高，相反它对于带宽需求非常敏感，因而它是高端GPU的最佳显存搭档。对比传统的GDDR（Graphics Double Data Rate，即我们常规认识的各类显卡上的核心部件之一显存），HBM可提供高达460GB/s的带宽，是GDDR的4倍多，而功耗仅为GDDR的一半。

HBM发展现状与趋势？

HBM每一次更新迭代都会伴随着处理速度的提高。HBM产品已经从HBM（第一代）迭代到最新的HBM3E（它是HBM3的扩展版本）。如果按照HBM3E目前的速率，下载一部长达163分钟的全高清（Full-HD）电影（1TB）只需不到1秒钟的时间。

尽管DRAM和Flash等作为传统的存储芯片技术在面对AI处理大量数据时显得力不从心，但由于HBM的技术复杂性以及生产难度限制了其在成本敏感的场景应用，因而在整体存储市场占有率较低，目前还不是普及性应用的产品。

HBM最先是由海力士与AMD于2013年联合推出的，但最终入局的玩家是SK海力士、三星和美光。2023年英伟达发布H200芯片，即采用了海力士提供HBM3e内存。同样于2024年推出的地表最强GPU B200，号称配备了192GB内存和高达8TB/S带宽，也是因为其采用了HBM--HBM3e堆叠技术。