总结:计算机组成与设计(硬件/软件接口)-第四章 处理器

第四章 处理器

    这一章可以看到,处理器的数据通路和控制通路的设计,可以从指令集系统和对工艺基本特性的理解开始。在 4.3 节,可以看到了在指令集体系结构确定和决定使用单周期实现的基础上,如何构造 MIPS 处理器的数据通路。当然,背后的工艺也影响许多设计决策,如数据通路中哪些部件可用,以及单周期实现是否有意义等。

    流水线提高了吞吐率,但不能提高指令的内在执行时间;对某些指令而言,指令延迟与单周期实现的延迟类似。多发射增加了额外的允许每个时钟周期发射多条指令的数据通路硬件,但是却增加了有效延迟。为了减少简单的单周期实现数据通路的时钟周期,提出了流水线技术。相比之下,多发射关注于减少每条指令的时钟周期数。

    流水线和多发射都试着开发指令级并行。开发更高指令级并行的主要限制因素是存在数据相关的控制相关。在软硬件上都使用预测来调度和推测,是降低相关带来影响的主要手段。

    我们展示了将 DGEMM 的循环展开 4 次来开发指令级并行,利用 Core i7 的乱序执行机制可使性能提升一倍以上。

    希望我的总结可以帮助大家,感谢阅读我的博客!

已标记关键词 清除标记
计算机组成原理:硬件/软件接口 第五版英文原版答案 《计算机组成设计硬件/软件接口(原书第5版)》是计算机组成设计的经典畅销教材,第5版经过全面更新,关注后PC时代发生在计算机体系结构领域的革命性变革——从单核处理器到多核微处理器,从串行到并行。本书特别关注移动计算和云计算,通过平板电脑、云体系结构以及ARM(移动计算设备)和x86(云计算)体系结构来探索和揭示这场技术变革。   与前几版一样,本书采用MIPS处理器讲解计算机硬件技术、汇编语言、计算机算术、流水线、存储器层次结构以及I/O等基本功能。   《计算机组成设计硬件/软件接口(原书第5版)》特点   更新例题、练习题和参考资料,重点关注移动计算和云计算这两个新领域。   涵盖从串行计算到并行计算的革命性变革,第6专门介绍并行处理器,每中都涉及并行硬件软件的相关主题。   全书采用Intel Core i7、ARM Cortex-A8和NVIDIA Fermi GPU作为实例。   增加“运行更快”这一新实例,说明正确理解硬件技术的重要性,它能使软件性能提高200倍。   讨论并强调计算机体系结构的“8个伟大思想”——通过并行提高性能、通过流水线提高性能、通过预测 提高性能、面向摩尔定律的设计、存储器层次、使用抽象简化设计、加速大概率事件和通过冗余提高可靠性
相关推荐
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页