Trace Cache
1 前言
当今应用程序对处理器性能的需求不断增加,而改进指令提取的机制,使得处理器能以更短的时间读取更多的指令,能有效提高处理器的性能。Trace Cache正是一种可以加快指令提取的技术。相比于指令Cache存储静态代码块,Trace Cache存储的基本单元是动态的指令流,可以有效减少取错指令的情况。例如,在静态代码块中,由于分支跳转指令的存在,在分支跳转指令后的指令程序可能不会执行,此时如果将这部分代码存入指令Cache中,不仅会造成存储空间的浪费,也会影响处理器提取指令的速度。
2 Trace Cache技术
- Trace Cache的基本组成单元是Trace。
- Trace :程序执行时的动态指令流,是局部的指令轨迹。由于 Trace Cache 容量大小有限制,因此 Trace Cache 中的每条Trace最多只能记录n条指令或者m个基本块(基本块是指两个控制转移之间的指令)。
- 一条 Trace 可以由 一个起始地址和最多 m-1 条分支输出确定。
2.1 Trace Cache的基本原理
Trace Cache 的工作过程是: 当首次遇到一条指令轨迹( Trace )时,就在 Trace Cache 中为之分配一个 Cache 行。如果程序继续执行中再次碰到一条已经缓存的 Trace 就直接读取,而不需要从指令 Cache 中读取。更详细地说:Trace Cache 接收到指令地址后,结合分支预测的结果,即可确定该条 Trace ,再到 Trace Cache 中判断是否命中,若命中该条 Trace ,就预取这些指令。
Trace Cache 的核心思想就是:缓存逻辑上的指令流,而不是缓存物理顺序的指令流。从而加快指令的预取。