文献阅读（218）EHP

tiaozhanzhe1900

已于 2024-09-03 11:28:41 修改

阅读量190

点赞数 2

分类专栏：芯片互联文章标签：硬件架构

于 2024-09-02 23:28:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tiaozhanzhe1900/article/details/141829494

版权

芯片互联专栏收录该内容

38 篇文章 39 订阅

订阅专栏

题目：A Research Retrospective on the AMD Exascale Computing Journey
时间：2023
会议：ISCA
研究机构：AMD

题目：Realizing the AMD Exascale Heterogeneous Processor Vision
时间：2024
会议：ISCA
研究机构：AMD

EHPv1 2012

最开始EHP，是基于DRAM堆叠+silicon interposer
在这里插入图片描述

EHPv2 2014

开始有chiplet的概念，4个CPU chiplet (CCD) + 1个IO Die + 16层DRAM堆叠+silicon interposer
当然CPU部分还是用的有机衬底
在这里插入图片描述

EHPv3 2016

DRAM stack高度从16降到8，GPU和CPU下面都使用active interposer，GPU资源翻倍
在这里插入图片描述

EHPv4 2018

为了降成本，使用了passive interposer，但是封装面积更大了，CPU CCD的数量从v3的8个降低到2个
在这里插入图片描述
问题在于IO Die的IF接口是为了CPU的DDR级别带宽设计的，对于GPU HBM级别的带宽支持有困难，而且两个GPU die离得比较远，通信开销更大，而且CPU访问HBM也很远

The overall chiplet topology creates a relatively long path from the CPU chiplets to the HBM, requiring two die-todie IF hops (plus the data fabric/network-on-chip traversals within the IOD and GPU) to get to the memory,

EHPv4的封装面积也没有得到充分利用

MI300A

XCD：5nm工艺，GPU计算引擎，CDNA 4架构
CCD：5nm工艺，Zen4架构，一个CCD有8核+32MB L3
IO die：memory-side cache共256MB

tiaozhanzhe1900

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
文献阅读（218）EHP

开始有chiplet的概念，4个CPU chiplet (CCD) + 1个IO Die + DRAM堆叠+silicon interposer。最开始EHP，是基于DRAM堆叠+silicon interposer。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。