编写高效代码(8) 程序、数据访问符合Cache的时间、空间局部性

最新推荐文章于 2024-08-15 21:19:15 发布

chenchong_219

最新推荐文章于 2024-08-15 21:19:15 发布

阅读量1.9k

点赞数

分类专栏：大话处理器

大话处理器专栏收录该内容

8 篇文章 1 订阅

订阅专栏

Cache正是利用了程序、数据访问时的时间局部性和空间局部性，为了使Cache的访问效率最高，程序和数据的组织，也应该要符合这两个特性。最典型的例子就是二维数组的访问，下面就是一个二维数组：

二维数组

如果a[i][j]在Cache中，那么a[i][j+1]就很可能也在Cache中，但是a[i+1][j]则不一定。于是代码这样写就不太好：

for(j=0; j<500; j++)

{

for(i=0; i<500; i++)

{

sum += a[i][j];

}

}

应该采用如下的写法，Cache的效率才高：

for(i=0; i<500; i++)

{

for(j=0; j<500; j++)

{

sum += a[i][j];

}

}

再来看另一个例子，在下面的这段代码中：

int a[4], b[4], i;

for (i = 0; i < 4; i++)

{

b[i] = Func(a[i]);

}

如果a和b数组存放在不同的Cache line中，一开始访问a会产生一次Cache miss，一开始访问b也会产生一次Cache miss，如果a和b数组存放在一个Cache line之中，则只会产生一次Cache miss。

在一起使用的数据放在一起能减少数据的Cache miss，在一起使用的函数放在一起能减少程序的Cache miss。

程序的组织也要符合Cache局部性原则。例如，一个程序大小为40K Bytes，经常使用的代码占据30K，很少使用的代码（如初始化、异常处理等）占据10K，指令Cache为32K Bytes，这段程序是无法完全放在Cache中的，我们可以将经常执行的代码放在一起，将很少使用的代码放在一起。这样经常使用的代码就能完全进入Cache中，减少了Cache miss。

有些较好的编译器能分析函数的调用关系，并合理的安排函数的存储位置，以提高指令Cache的命中效率。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。