NoC论文
文章平均质量分 93
正在輸入......
这个作者很懒,什么都没留下…
展开
-
【DAC‘ 2022】Kite: A Family of Heterogeneous Interposer Topologies
出于说明目的,我们使用三种不同的链路长度(1-1 对角线、2 直线和 2-1 对角线)演示此策略,构建三种拓扑 - Kite-Small、Kite-Medium 和 Kite-Large 使用这些分别作为最长的链接。由此产生的拓扑如图 2 所示。一般来说,由于跳数的增加,随着核心数量的增加,数据包所经历的延迟也会增加。我们发现,具有较短链路的拓扑可以利用较高的工作频率,从而提供更好的延迟和更高的吞吐量。为此,我们定义了一个称为有效跳数 (Heff) 的指标作为设计我们提出的 NoI 拓扑的代理。原创 2024-04-10 21:18:21 · 825 阅读 · 0 评论 -
【Micro 2014】NoC Architectures for Silicon Interposer Systems
硅中介层技术(“2.5D”堆叠)能够将多个内存堆栈与处理器芯片集成,从而大大增加封装内内存容量,同时很大程度上避免处理器上 3D 堆栈 DRAM 的热挑战。使用内插器来提供芯片之间的点对点互连。然而,这些互连仅利用中介层整体布线能力的一小部分,在这项工作中,我们探索如何利用这一未使用的资源。描述了一种扩展片上网络 (NoC) 架构的通用方法,以更好地利用硅中介层的额外路由资源。我们提出了一种非对称组织,将 NoC 分布在多核芯片和中介层上,其中每个子网在流量类型、拓扑、使用或不使用集中、直接与不使用原创 2024-03-30 13:22:23 · 623 阅读 · 0 评论 -
【HPCA‘ 2008】Regional Congestion Awareness for Load Balance in Networks-on-Chip
较大的网络直径会降低 RCA 设计的有效性,因为在本地和传播竞争指标的权重为 50-50 的情况下,本地指标的小波动可能会超过强大的远程趋势。实验表明,RCA 在所有检查的工作负载中均达到或超过了传统自适应路由的性能,在 49 核 CMP 上运行的 SPLASH-2 基准测试中,平均延迟降低了 16%,最大延迟降低了 71%。在许多模拟工作负载中,4-VC RCA 设计能够匹配或超过 8-VC 本地路由器的性能,从而使 RCA 成为面积受限设计的有吸引力的选择。我们添加的两个新模块是拥塞状态聚合和传播。原创 2024-03-16 00:08:07 · 750 阅读 · 0 评论