缓存一致的系统最大限度地将你的东西隐藏起来.我想你将不得不间接地观察它,要么通过使用性能计数寄存器来检测高速缓存未命中,要么仔细测量使用高分辨率定时器读取内存位置的时间.
这个程序适用于我的x86_64框以演示clflush的效果.使用rdtsc读取全局变量需要多长时间.作为一个直接与cpu时钟相关的指令,直接使用rdtsc是理想的选择.@H_301_3@
这是输出:@H_301_3@took 81 ticks
took 81 ticks
flush: took 387 ticks
took 72 ticks
你会看到3个试验:第一个确保我在缓存中(它是,因为它只是零作为BSS的一部分),第二个是读取我应该在缓存中的.然后,clflush将我从缓存中(连同其邻居)踢出来,并显示重新读取需要更长的时间.最终读取验证它是否回到缓存中.结果是非常可重复的,差异足够大,很容易看到缓存未命中.如果您关心校准rdtsc()的开销,您可以使差异更加显着.@H_301_3@
如果您无法读取要测试的内存地址(尽管/ dev / mem的mmap甚至可以用于这些目的),如果您知道高速缓存的缓存线大小和关联性,则可以推断出所需的内容.然后,您可以使用可访问的内存位置来探测您感兴趣的集合中的活动.@H_301_3@
源代码:@H_301_3@#include
#include
inline void
clflush(volatile void *p)
{
asm volatile ("clflush (%0)" :: "r"(p));
}
inline uint64_t
rdtsc()
{
unsigned long a,d;
asm volatile ("rdtsc" : "=a" (a),"=d" (d));
return a | ((uint64_t)d << 32);
}
volatile int i;
inline void
test()
{
uint64_t start,end;
volatile int j;
start = rdtsc();
j = i;
end = rdtsc();
printf("took %lu ticks\n",end - start);
}
int
main(int ac,char **av)
{
test();
test();
printf("flush: ");
clflush(&i);
test();
test();
return 0;
}