- 博客(2)
- 资源 (6)
- 收藏
- 关注
原创 Intel X86 优化指南阅读笔记--通用优化(前端)
PROCESSOR PERSPECTIVES 以下优化建议,在不同微架构下收益差别较大: 指令译码的吞吐量很重要。利用好decoded ICache,Loop Stream Detector和macro-fusion能进一步提高CPU前端性能。 充分利用好4个译码器来产生代码。利用好micro-fusion和macro-fusion,这样其中3个简单译码器就再被限制为只能译码只含有一条uo...
2018-08-26 21:31:00 1998
原创 Intel X86 优化指南阅读笔记--基础体系结构
Intel Sandy Bridge Microarchitecture 流水线 前端按顺序取指令和译码,将X86指令翻译成uop。通过分支预测来提前执行最可能的程序路径。 带有超标量功能的执行引擎每时钟周期最多执行6条uop。带有乱序功能的执行引擎能够重排列uop执行顺序,只要源数据准备好了,即可执行uop。 顺序提交功能确保最后执行结果,包括碰到的异常,跟源程序顺序一致。 ...
2018-08-24 09:43:29 2337 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人