4. cache预取
背景:cache操作对大多数程序员透明,但当对程序执行效率有很高要求的时候,程序员可以一定程度上控制cache。
4.1 Cache局部性
①时间局部性:程序即将用到的指令或数据,可能就是目前正在使用的指令或数据,可以在当前的指令数据使用完后暂存在cache中。典型的例子就是for循环。
②空间局部性:程序即将使用的指令或数据可能与目前正在使用的指令或数据在空间上相邻或相近。所以可以在处理当前指令数据时,把内存中相邻区域的指令或数据也读到cache里。典型的例子就是处理数组。
4.2 预取
NetBurst架构硬件预取:有两个硬件预取单元,分别对应数据和指令,激活后可以自动预取下一个cache line的数据。预取只发生在同一个页内,不会预取到其他页。
实例:对二维数组arr[1024][1024]赋值
for(int i = 0; i < 1024; i++) for(int j = 0; j < 1024; j++) arr[i][j] = 1; }
|
for(int i = 0; i < 1024; i++) for(int j = 0; j < 1024; j++) |