提高cache命中率

最新推荐文章于 2024-08-02 17:21:17 发布

aolitianya

最新推荐文章于 2024-08-02 17:21:17 发布

阅读量390

点赞数 8

分类专栏： Linux 性能编程文章标签：算法 linux

本文链接：https://blog.csdn.net/aolitianya/article/details/138316318

版权

Linux 同时被 3 个专栏收录

60 篇文章 0 订阅

订阅专栏

编程

9 篇文章 0 订阅

订阅专栏

性能

6 篇文章 0 订阅

订阅专栏

文章讨论了CPU如何通过缓存提高程序运行速度，通过C代码实例展示了不同编译选项对缓存命中率的影响。测试显示，优化缓存使用能显著降低L1缓存miss并提高IPC值。

摘要由CSDN通过智能技术生成

CPU读取数据的时候，不是直接访问内存，而是先访问缓存，缓存没有命中的情况下才会去访问内存，如果缓存命中则直接从缓存中读取数据，由于缓存的速度要远高于内存，因此充分利用CPU的cache来缓存数据，提高cache命中率能够大幅度提高程序的运行速度。

下面是一个实际的测试代码：

#include <stdio.h>
#include <stdlib.h>

#define SIZE 10000
//#define DEBUG
int main(){
	double a[SIZE][SIZE];
	double b[SIZE][SIZE];
	double c[SIZE][SIZE];
#ifdef DEBUG
	for(int j = 0; j < SIZE; j++){
		for(int i = 0; i < SIZE; i++){
#else
	for(int i = 0; i < SIZE; i++){
		for(int j = 0; j < SIZE; j++){
#endif
			a[i][j] = 8.3 * i  + 1.2 * j;
			b[i][j] = 12.3 * i + 3.4 * j;
		}
	}
#ifdef DEBUG
	for(int j = 0; j < SIZE; j++){
		for(int i = 0; i < SIZE; i++){
#else
	for(int i = 0; i < SIZE; i++){
		for(int j = 0; j < SIZE; j++){
#endif
			c[i][j] = a[i][j] + b[i][j];
		}
	}
	return 0;
}

在上述代码中，我们使用宏定义来实现两种不同的数组访问顺序。

我们根据不同的标识来进行编译

编译的第一个二进制是利用cache的t1

gcc -o t1 t.c

编译的第二个二进制是t2

gcc -o t2 t.c -DDEBUG

首先我们测试这两个程序的运行时间，可以看到在相同的环境下，t2运行的时长是t1的四倍