GEM5 +McPAT 联合仿真功率面积: McPAT论文

最新推荐文章于 2024-09-21 11:48:13 发布

yz_弘毅道远

最新推荐文章于 2024-09-21 11:48:13 发布

阅读量868

点赞数 2

分类专栏：片上网络NoC GEM5 文章标签：硬件架构

本文链接：https://blog.csdn.net/qq_34898487/article/details/134538619

版权

GEM5 同时被 2 个专栏收录

40 篇文章

订阅专栏

片上网络NoC

37 篇文章

订阅专栏

简介

GEM5 和McPAT 是非常常见的组合，这里介绍了McPAT的论文原理和细节。但不包括如何命令行使用McPAT 工具，不包括具体的文件IO，专注于理解McPAT。

论文

S. Li, J. H. Ahn, R. D. Strong, J. B. Brockman, D. M. Tullsen and N. P. Jouppi, “McPAT: An integrated power, area, and timing modeling framework for multicore and manycore architectures,” 2009 42nd Annual IEEE/ACM International Symposium on Microarchitecture (MICRO), New York, NY, USA, 2009, pp. 469-480.

这是2009年Micro的论文。
它对比的选择是CACTI。 WATCH。 1他们首先不考虑时序和面积，然后只有动态功耗。2然后WATCH仅对动态功耗进行建模。 3最后WATCH用的简单的线性缩放，对新的(当时是0.8 微米)制成工艺不准，
ORION专门考虑noc，包括面积动态功耗和leakage。但是没有时序的考虑，也没有考虑短路。

初步接触

McPAT是一个读取输入的xml，提供输出结果的程序。

./mcpat -infile input.xml -print_level 5 > output.log

在这里插入图片描述
输入大概如下

输出如下：

如果只看noc的部分是

用户/使用者角度看过程： two-stage modeling

用户提供目标时钟频率、面积和功率偏差、优化函数以及其他架构/电路/技术参数以后：
1。Mc-PAT 对设计空间进行智能且广泛的搜索。对于每个处理器组件，McPAT 优化电路级结构以满足时序约束。然后，如果所得功率或面积不在迄今为止找到的最佳值的允许偏差范围内，则丢弃该配置。最后，在满足功率和面积偏差的配置中，McPAT应用优化函数来报告最终的功率和面积值。模块功率、面积和时序模型以及优化器生成的最终芯片表示一起用于计算最终芯片面积、时序和峰值功率。

根据统计数据生产运行时功耗。

从设计者角度看过程：集成与三层建模框架

集成指：同时对功率、面积和时序进行建模的功能。因此，从电气角度来看，McPAT 能够确保结果相互一致。
分层指：它将模型分解为三个层次：
这为用户提供了跨几代实现技术对各种可能的多核配置进行建模的灵活性。总而言之，这种集成的分层方法使用户能够绘制设计空间的全面图景，探索设计和技术选择之间在功耗、面积和时序方面的权衡。
下面我们看他怎么介绍架构、电路和技术建模。

架构层次建模

这里有 core 核心，NoC片上网络，onchip caches 片上缓存，内存控制器，时钟电路。

core 核心

“一个核心可以分为几个主要单元：指令获取单元（IFU）、执行单元（EXU）、加载和存储单元（LSU）以及乱序（OOO）发出/调度单元。 OOO 处理器。它们中的每一个都可以进一步分为硬件结构。例如，EXU 可以包含 ALU、FPU、旁路逻辑和寄存器文件。在我们的分层框架中，ALU 和 FPU 映射到电路级的复杂逻辑模型。旁路逻辑可以映射到线路和逻辑模型的组合，而寄存器文件可以映射到阵列模型。 McPAT 支持基于现有高性能 OOO 处理器的详细且真实的模型。我们极大地扩展了 Palacharla 等人的基本分析模型。的工作 [33] 支持基于保留站（数据捕获调度程序）的架构，例如Intel P6架构 [16] 和基于物理寄存器文件（非数据捕获调度程序）的架构，例如如 Intel Netburst [15] 和 DEC Alpha 架构 [19] . McPAT 支持基于 RAM 和 CAM 的重命名逻辑，这些逻辑可以在 Intel 和 Alpha 架构中找到。
McPAT 还对多线程处理器的功率、面积和时序进行建模，无论是有序（例如 Sun Niagara）还是无序（例如 Intel Nehalem）。由于 McPAT 已包含每个基本处理器的模型，因此通过对硬件资源的共享和重复以及额外的硬件开销进行建模来包含多线程支持。 McPAT 基于 Niagara 处理器 [20] 、 [31] （英特尔超线程技术 [21]）和 SMT 架构 [42] 的早期研究的设计对多线程架构进行建模。 ”

NoC

NoC 有两个主要组件：信号链路和路由器。所述对于信号链路，我们使用分层线路，如第 4.2.2 节。我们使用与内核建模相同的分析方法来对路由器进行建模：将路由器分解为基本构建块，例如 flit 缓冲区、仲裁器和交叉开关；然后为每个构建块构建分析模型。 Orion 2 [18] 与仅对面积和功率建模的不同，McPAT 对功率、面积和时序建模。 McPAT 是第一个支持双泵浦交叉开关的建模工具 [43] ，它可以减少片上互连密集型设计的芯片面积。