现代处理器设计——超标量处理器基础(执行多线程)

本文探讨现代处理器设计中的超标量处理器基础,强调执行多线程的关键概念。内容涉及load-locked/store-conditional操作,目录一致性实现的优缺点,以及监听/目录混合系统。还讨论了 CMP(Chip Multi-Processor)的优势与挑战,隐式多线程(IMT)技术,如控制无关线程、主动分离执行(DEE)和线程级推测(TLS)。文章旨在深入理解处理器如何通过多线程提高性能和效率。
摘要由CSDN通过智能技术生成

现代处理器设计——超标量处理器基础(执行多线程)

  1. 构造多处理机系统的挑战:如何为所有的线程提供一致的存储器视图,同时尽量减少平均访存延迟。

  2. load-locked/store-conditional:读出一个值,执行其他任意操作,然后试图将数据存到同一地址。如果中间插入其他任何一个线程的针对于同一地址的写操作,都会导致写条件失败。

    实现:每条LL指令必须记住它读取的地址,所有后续的写操作必须检查写地址,确定是否与LL指令读取的地址匹配。最后当stc执行时,同样必须检查地址,确定是否与链接地址匹配,如果匹配,stc允许执行,否则stc失败并设置条件码

  3. 目录一致性实现的优点:

    • 带宽扩展:目录的带宽随着存储器的带宽增长而增长,同时通过在目录中过滤掉一些命令,减少了对于地址总线带宽的需求。
    • 访存延迟:cache失效的延迟能够显著地减少。因为一旦存储器完成对目录的检查,就能提供数据。同时私有数据在本地存储器中,访问延迟也很低
    • 缺点:当发生cache失效而所请求的行在远程cache中是dirty时,会带来额外的延迟。
  4. 监听/目录混合系统:在小部分的处理机集合中使用传统的,基于总线的监听协议来维护一致性,但是多个集合之间的一致性是通过建立在可扩展一致性结构标准上的目录协议实现的。混合机制具有目录机制的可扩展的优点,同时对于能够在本地监听域内满足的通信失效,保持了较低的平均延迟

  5. CMP的好处:在单个芯片上集成多个处理器使得多个处理器的封装和互连的物理实现变得容

超标处理器设计》讲述超标SuperScalar)处理器设计现代的高性能处理器都采用了超标结构,大至服务器和高性能PC的处理器,小至平板电脑和智能手机的处理器,无一例外。《超标处理器设计》以超标处理器的流水线为主线展开内容介绍。《超标处理器设计》主要内容包括超标处理器的背景知识、流水线、顺序执行和乱序执行两种方式的特点;Cache的一般性原理、提高Cache性能的方法以及超标处理器中的Cache,尤其是多端口的Cache;虚拟存储器的基础知识、页表、TLB和Cache加入流水线后的工作流程;分支预测的一般性原理、在超标处理器中使用分支预测时遇到的问题和解决方法以及如何在分支预测失败时对处理器的状态进行恢复;一般的RISC指令集体系的简单介绍;指令解码的过程,尤其是超标处理器中的指令解码;寄存器重命名的一般性原理、重命名的方式、超标处理器中使用寄存器重命名时遇到的问题和解决方法以及如何对寄存器重命名的过程实现状态恢复;指令的分发(Dispatch)和发射(Issue)、发射过程中的流水线、选择电路和唤醒电路的实现过程;处理器中使用的基本运算单元、旁路网络、Cluster结构以及如何对Load/Store指令的执行过程进行加速;重排序缓存(ROB)、处理器状态的管理以及超标处理器中对异常的处理过程;经典的Alpha21264处理器的介绍。在本书中使用了一些现实世界的超标处理器作为例子,以便于读者加深对超标处理器的理解和认识。 《超标处理器设计》可用作高等院校电子及计算机专业研究生和高年级本科生教材,也可供自学者阅读。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值