CPU知识

CPU指令摩尔定律流水线带来的问题旁路 Bypassing停滞 Stalls分支 Branches分支预测分支断定提升IPC instructions per cycle指令调度乱序执行存储器架构/ 层次 memory hierarchy缓存存储器的另外设计考虑CPU内部的并行性向量运算数据级并行多核锁、一致性、同一性现实的困境新摩尔定律结论指令举例:算数、访存、控制最优化目标:cycles/instruction * seconds/cycleCPI(每条指令的时钟数)&时间周期桌面
摘要由CSDN通过智能技术生成

指令

举例:
算数、访存、控制
最优化目标:
cycles/instruction * seconds/cycle
CPI(每条指令的时钟数)&时间周期

桌面应用的特点:大量时间用于访存

摩尔定律

芯片的集成密度每两年翻一番,成本下降一半。

流水线

取指、译码、执行、访存、写回

利用指令级并行,极大地减小时钟周期,增加了一些延迟和芯片面积

带来的问题

  • 具有依赖关系的指令
  • 分支怎么处理

旁路 Bypassing

停滞 Stalls

分支 Branches

分支预测

猜测下一条指令
基于过去的分支记录

分支断定

不使用分支预测器
优势:减少面积,减少错误预测

提升IPC instructions per cycle

常规IPC受限于instrus per clock
超标量 Superscalar - 增加流水线宽度

指令调度

乱序执行 out of order execution
重排指令,获取最大的吞吐率
重排缓存区
发射队列/调度

乱序执行

IPC接近理想状态

  • 面积增加
  • 功耗增加

存储器架构/ 层次 memory hierarchy

存储器越大越慢
粗略的估计

缓存

将数据放在尽可能接近的位置
利用:

  • 时间临近性
  • 空间临近性

硬件管理

  • L1 instruction/Data caches
  • L2 unified cache
  • L3 unified cache

级越小,速度越快,容量越小

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值