《代码优化：有效使用内存》读书笔记（二）——优化技巧之消除数据相关性

最新推荐文章于 2022-01-13 11:41:29 发布

莫失莫忘

最新推荐文章于 2022-01-13 11:41:29 发布

阅读量521

点赞数 1

分类专栏： IT技术讨论文章标签：优化读书存储测试 c

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuyanjie0903/article/details/6915712

版权

IT技术讨论专栏收录该内容

7 篇文章 0 订阅

订阅专栏

如果请求的RAM单元存在地址-数据相关性（也就是说，一个单元含有另一个单元的地址），那么CPU不能并行地处理他们，而在得到地址之前必须等待。以while(next=p[next])为例来考虑这种情况。
在处理器得到next变量值之前，它不会知道下一个单元的地址而不能开始加载它。这样一个循环的执行时间主要由内存子系统的延时决定，而与它的吞吐量很少有关。
与之相对的是while(a=p[next++])。处理器请求芯片组加载p[next]单元，并立即将next加1.用不着等待应答(因为下一个单元的地址是知道的)，处理器向芯片组一个接一个地发送请求信息。处理器持续发送请求信息直到尚未处理的请求个数达到最大值为止。犹豫一个接着一个出现的请求之间存在最小限度的延时，它们可以被看做是并行处理的。加载N个相关单元所需要的时间一般可以由下式表达：
t = N(T_ch + T_mem)
其中，T_ch是芯片组等待时间，而Tmem表示存储器等待时间。因而，加载相同数目的非相关单元所需要的时间为：
t = N/C*(T_ch + T_mem)
这个公式中的C是存储器子系统的吞吐量。
这样一来，在处理非相关数据时，存储器子系统延时的负面影响会很明显地降低，因此性能主要决定于吞吐量。
同样，笔者也在计算机上对两种处理方式进行了测试，处理非相关数据可以提速1.7~2.5倍。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《代码优化：有效使用内存》读书笔记（二）——优化技巧之消除数据相关性

如果请求的RAM单元存在地址-数据相关性（也就是说，一个单元含有另一个单元的地址），那么CPU不能并行地处理他们，而在得到地址之前必须等待。以while(next=p[next])为例来考虑这种情况。在处理器得到next变量值之前，它不会知道下一个单元的地址而不能开始加载它。这样一个循环的执行时间主要由内存子系统的延时决定，而与它的吞吐量很少有关。与之相对的是while(a=p[n
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。