如何编写100% cache miss的C程序

最新推荐文章于 2023-02-16 16:22:30 发布

嵌入式linux

最新推荐文章于 2023-02-16 16:22:30 发布

阅读量1.6k

点赞数

分类专栏：点滴积累文章标签： cache 处理器 x86

点滴积累专栏收录该内容

185 篇文章 0 订阅

订阅专栏

http://blog.csdn.net/qianlong4526888/article/details/12872819

今天为了做ppt讲解如何使用oprofile（以测试cache miss为例），要写一个cache miss的小例子，以Level 2 data cache为例，具体步骤见下文。

1、查看你的系统cache大小：

$ cat /sys/devices/system/cpu/cpu0/cache/index2/size

我的系统是centos 5.8。以上命令是查看Level 2cache的大小，在我的服务器上是256k，记住这个数，写程序时要用。

2、查看cache line的大小：

$ cat /sys/devices/system/cpu/cpu0/cache/index2/coherency_line_size

我的服务器上是64，单位是bytes，记住这个数，也要用到。

3、编写测试程序cache.c：

[cpp] view plain copy print ?

int matrix[8192][16]; //4*8192*16=2^18=512k bytes
void bad_access()
{
int k, j, sum = 0;
for(k = 0; k < 16; k++)
for(j = 0; j < 8192; j++)
sum += matrix[j][k];
}
int main()
{
int i;
for(i = 0; i< 5000000; i++)
bad_access();
return 0;
}

int matrix[8192][16];   //4*8192*16=2^18=512k bytes

void bad_access()                                                                                                                      
{
    int k, j, sum = 0;
    for(k = 0; k < 16; k++)
        for(j = 0; j < 8192; j++)
            sum += matrix[j][k]; 
}

int main()
{
    int i;
    for(i = 0; i< 5000000; i++)
        bad_access();
    return 0;
}

以上代码虽然简单，但要理解需要懂cache的简单结构及原理：cache是以64字节或者128字节为一行的，分为多组（或者叫多路），每次发生cache miss取数据时，cache会按照cache line为单位（这里也就是一次取64字节）从内存取数据。

第一步得知level 2 data cache总大小是256k，第二步得到每个cache line是64字节，所以，level2 data cache共256k/64=2^12=4096行。

想象一个表，每行64字节，一共4096行，共256k大小，这就是我们cache的简单结构。为了保证每次取数据都会发生miss，我们必须以>=64字节的步长取数据。

首先创建一个512K大的数组，要比cache大一倍。如果数组也是256k，当第一次循环结束，数组用完后再次从头开始取数据时，cache就不再被替换，所以不会再发生cache miss，为了保证每次取数据都要发生cache miss，数组必须至少是cache大小的两倍及以上。

循环读取数组中的数据，每次读一个int大小，然后加64，再读取下一个cache line的数据，循环直到数组数据全部取出。

oprofile统计cache miss有个最低限制（我的0.9.8版本是2000000次），所以发生的miss数太小的话是娶不到的，所以加大循环次数至5000000。

4、至此可以进行100% cache miss的测试了，但是经过测试发现 cache miss压根没发生，百思不得其解，请教boss后才想起来，x86有个stream buffer硬件预取器，如果你取数据非常规律，那么硬件预取器经过训练后，会在你真正取数据之前，将你要的数据直接放到cache中。所以，要在至强处理器的服务器上做cache miss测试，必须重启系统后，关闭硬件预取器。否则就要修改程序，写出真正随机取数据的代码，但是这无法保证cache miss 率是100%，只能保证cache 命中率比较低而已。

5、SPEC CPU2006中的mcf发生cache miss rate很高，可以用其做测试。

嵌入式linux

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
如何编写100% cache miss的C程序

http://blog.csdn.net/qianlong4526888/article/details/12872819今天为了做ppt讲解如何使用oprofile（以测试cache miss为例），要写一个cache miss的小例子，以Level 2 data cache为例，具体步骤见下文。1、查看你的系统cache大小：$ cat /sys/devices/system/cp
复制链接

扫一扫