[中英对照]学习笔记(零)简介与资源-计算机体系结构量化研究方法-Computer Architecture A Quantitative Approach

本文是关于Computer Architecture: A Quantitative Approach的学习笔记,涉及能量、功率、集成电路成本等公式,以及缓存优化、高性能处理器、多核处理器和仓库规模计算机等内容。书中引用了RISC-V、ARM和Intel Core i7等实例,并探讨了DSAs在计算机架构中的作用。
摘要由CSDN通过智能技术生成

[中英对照]学习笔记(零)简介与资源-计算机体系结构量化研究方法-Computer Architecture A Quantitative Approach

学习笔记

学习笔记(一)量化设计与分析基础
学习笔记(二)

简介与资源

本学期修Computer Architecture,老师把这本书当作reference,更新应该不快,跟着课程走(周更吧,应该)。本人能力很差,请各位见谅。有时间的话我也会附上学校的ppt和作业解答。感谢作者及译者的付出,感谢各位的阅读。

​Reference:

John L. Hennessy, David A. Patterson (2019) Computer Architecture: A Quantitative Approach, 6th Edition. Morgan Kaufmann
量化研究方法(第5版)贾洪峰

资源:

中文第五版:https://www.jb51.net/books/530616.html
英文第六版:https://www.jb51.net/books/657416.html#downintro2
原书提供资料的网站:https://www.elsevier.com/books/computer-architecture/hennessy/978-0-12-811905-1,

各章简介(机翻)

第 1 章包括能量、静态功率、动态功率、集成电路成本、可靠性和可用性的公式。 (这些公式也可以在封面内页找到。)我们希望这些主题可以在本书的其余部分中使用。除了计算机设计和性能测量的经典定量原理外,它还显示了通用微处理器性能提升的放缓,这是特定领域架构的灵感之一。我们的观点是指令集架构在今天所扮演的角色不如 1990 年,因此我们将本材料移至附录 A。它现在使用 RISC-V 架构。 (为了快速回顾,RISC-V ISA 的摘要可以在封底内找到。)对于 ISA 的爱好者,此版本的附录 K 进行了修订,涵盖了 8 种 RISC 架构(5 个用于桌面和服务器,3 个用于嵌入式使用)、80X86、DEC VAX 和 IBM 360/370。然后转到第 2 章的内存层次结构,因为很容易将成本-性能-能源原则应用于这种材料,而内存是关键资源其余章节。与上一版一样,附录 B 包含对缓存原理的介绍性回顾。

第 2 章讨论了缓存的 10 种高级优化。本章包括虚拟机,它在保护、软件管理和硬件管理方面具有优势,并在云计算中发挥着重要作用。除了涵盖 SRAM 和 DRAM 技术外,本章还包括有关闪存和使用堆叠芯片封装来扩展存储器层次结构的新材料。 PIAT 示例是用于 PMD 的 ARM Cortex A8 和用于服务器的 Intel Core i7。

第 3 章介绍了高性能处理器中指令级并行性的利用,包括超标量执行、分支预测
(包括新标记的混合预测器)、推测、动态调度和同时多线程。如前所述,附录 C 是对流水线的回顾,以备不时之需。第 3 章还调查了 ILP 的限制。与第 2 章一样,PIAT 的示例同样是 ARM Cortex A8 和 Intel Core i7。虽然第三版包含大量关于 Itanium 和 VLIW 的内容,但该材料现在位于附录 H 中,表明我们认为该架构不符合早先的主张。

多媒体应用程序(如游戏和视频处理)的重要性日益增加,也增加了可以利用数据级并行性的架构的重要性。特别是,人们对使用图形处理单元 (GPU) 进行计算的兴趣日益浓厚,但很少有架构师了解 GPU 的真正工作原理。我们决定在很大程度上写一个新的篇章来揭开这种新型计算机架构的面纱。

第 4 章首先介绍了向量架构,这是构建多媒体 SIMD 指令集扩展和 GPU 解释的基础。 (附录 G 更深入地介绍了矢量架构。)本章介绍了 Roofline 性能模型,然后使用它来比较 Intel Core i7 和 NVIDIA GTX 280 和 GTX 480 GPU。本章还介绍了用于 PMD 的 Tegra 2 GPU。

第 5 章介绍了多核处理器。它探索了对称和分布式内存架构,检查了组织原则和性能。本章的主要补充内容包括多核组织的更多比较,包括多核多级缓存的组织、多核一致性方案和片上多核互连。接下来是同步和内存一致性模型的主题。示例是英特尔酷睿 i7。对更深入的互连网络感兴趣的读者应该阅读附录 F,对更大规模的多处理器和科学应用感兴趣的读者应该阅读附录 I。

第 6 章描述了仓库规模计算机 (WSC)。它在 Google 和 Amazon Web Services 工程师的帮助下进行了广泛的修订。本章整合了很少有架构师了解的 WSC 的设计、成本和性能的详细信息。它从流行的 MapReduce 编程模型开始,然后描述 WSC 的架构和物理实现,包括成本。这些成本使我们能够解释云计算的出现,即在云中使用 WSC 进行计算比在本地数据中心进行计算更便宜。 PIAT 示例是对 Google WSC 的描述,其中包含本书首次发布的信息。

第7章激发了对领域特定的架构(DSAs)的需求。基于四个dsa的例子,制定了dsa的指导原则。每个DSA对应于已部署在商业设置中的芯片。考虑到通用微处理器的单线程性能已经停滞,我们还解释了为什么我们期望通过dsa实现计算机架构的复兴。这将把我们带到附录A到M。附录A涵盖了ISAs的原理,包括RISC-V,附录K描述了RISCV、ARM、MIPS、Power和SPARC的64位版本及其多媒体扩展。它还包括一些经典的体系结构(80x86、VAX和IBM360/370)和流行的嵌入式指令集(Thumb-2、microMIPS和RISCVC)。附录H是相关的,因为它涵盖了VLIWISAs的架构和编译器。如前所述,附录B和附录C是关于基本缓存和管道概念的教程。对缓存相对较新的读者应该在第2章之前阅读附录B,而那些新熟悉管道的读者应该在第3章之前阅读附录C。

附录D,“存储系统”,对可靠性和可用性进行了扩展的讨论,这是一个关于RAID的教程,描述了RAID6方案,并且很少发现真实系统的故障统计数据。它继续提供对排队理论和I/O性能基准测试的介绍。我们评估了一个真实集群的成本、性能和可靠性:互联网存档。“把一切放在一起”的例子是NetAppFAS6000文件。

附录E,由ThomasM.Conte撰写,将嵌入的材料整合在一个地方。

附录F,关于互联网络,由蒂莫西.平克斯顿和乔斯·杜阿托修订。附录G,最初由Krste阿萨诺维c编写,包括对向量处理器的描述。我们认为这两个附录是我们所知道的关于每个主题的最好的材料之一。

附录H描述了VLIW和EPIC,铟的体系结构。附录I描述了用于更大规模、共享内存多处理的并行处理应用程序和一致性协议。

附录J,由大卫·戈德堡撰写,描述了计算机算术。

附录L,由阿比谢克·巴塔查尔吉撰写,是一个新的版本,它讨论了内存管理的高级技术,重点是对虚拟机的支持和对非常大的地址空间的地址转换的设计。随着云处理器的增长,这些体系结构的增强变得越来越重要。

附录H描述了VLIW和EPIC,铟的体系结构。附录I描述了用于更大规模、共享内存多处理的并行处理应用程序和一致性协议。

附录J,由大卫·戈德堡撰写,描述了计算机算术。

附录L,由阿比谢克·巴塔查尔吉撰写,是一个新的版本,它讨论了内存管理的高级技术,重点是对虚拟机的支持和对非常大的地址空间的地址转换的设计。随着云处理器的增长,这些体系结构的增强变得越来越重要。

附录M将每一章的“历史视角和参考文献”收集为一个附录。它试图对每一章的想法和围绕这些发明的历史感觉给予适当的认识。我们喜欢把这看作是呈现计算机设计的人类戏剧。它还提供了建筑学专业的学生可能想要追求的参考资料。如果你有时间,我们建议你阅读这些章节中提到的该领域的一些经典论文。直接从创作者那里听到这些想法既令人愉快又有教育意义。“历史视角”是之前版本中最受欢迎的部分之一。

后续笔记

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值