[编程技巧] 巧用CPU缓存优化代码：数组 vs. 链表

最新推荐文章于 2022-11-04 21:45:03 发布

西塞安全

最新推荐文章于 2022-11-04 21:45:03 发布

阅读量3.4k

点赞数 1

文章标签：编程优化 access hierarchy 存储算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wingeek/article/details/4031387

版权

一个常见的编程问题： 遍历同样大小的数组和链表，哪个比较快？ 如果按照大学教科书上的算法分析方法，你会得出结论，这2者一样快，因为时间复杂度都是 O(n)。但是在实践中，这2者却有极大的差异。通过下面的分析你会发现，其实数组比链表要快很多。

首先介绍一个概念：memory hierarchy （存储层次结构），电脑中存在多种不同的存储器，如下表

CPU 寄存器 – immediate access (0-1个CPU时钟周期)
CPU L1 缓存 – fast access (3个CPU时钟周期)
CPU L2 缓存 – slightly slower access (10个CPU时钟周期)
内存 (RAM) – slow access (100个CPU时钟周期)
硬盘 (file system) – very slow (10,000,000个CPU时钟周期)

（数据来自 http://www.answers.com/topic/locality-of-reference）

各级别的存储器速度差异非常大，CPU寄存器速度是内存速度的100倍！这就是为什么CPU产商发明了CPU缓存。而这个CPU缓存，就是数组和链表的区别的关键所在。

CPU缓存会把一片连续的内存空间读入，因为数组结构是连续的内存地址，所以数组全部或者部分元素被连续存在CPU缓存里面，平均读取每个元素的时间只要3个CPU时钟周期。而链表的节点是分散在堆空间里面的，这时候CPU缓存帮不上忙，只能是去读取内存，平均读取时间需要100个CPU时钟周期。这样算下来，数组访问的速度比链表快33倍！ （这里只是介绍概念，具体的数字因CPU而异）

因此，程序中尽量使用连续的数据结构，这样可以充分发挥CPU缓存的威力。这种对缓存友好的算法称为 Cache-oblivious algorithm，有兴趣可以参考相关资料。再举一个简单例子：

对比

for i in 0..n
for j in 0..m
for k in 0..p
C[i][j] = C[i][j] + A[i][k] * B[k][j];
和

for i in 0..n

for k in 0..p
for j in 0..m
C[i][j] = C[i][j] + A[i][k] * B[k][j];

虽然两者执行结果一样，算法复杂度也一样，但是你会发现第二种写法要快很多。

总结一下，各种存储器的速度差异很大，在编程中绝对有必要考虑这个因素。比如，内存速度比硬盘快1万倍，所以程序中应该尽量避免频繁的硬盘读写；CPU缓存比内存快几十倍，在程序中尽量多加利用。

>> 原创文章的版权属于作者，转载请注明出处和作者信息(http://blog.csdn.net/WinGeek/)，谢谢。 <<

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
[编程技巧] 巧用CPU缓存优化代码：数组 vs. 链表

一个常见的编程问题：遍历同样大小的数组和链表，哪个比较快？如果按照大学教科书上的算法分析方法，你会得出结论，这2者一样快，因为时间复杂度都是 O(n)。但是在实践中，这2者却有极大的差异。通过下面的分析你会发现，其实数组比链表要快很多。首先介绍一个概念：memory hierarchy （存储层次结构），电脑中存在多种不同的存储器，如下表CPU 寄存器 –
复制链接

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。