代码运行一万遍和运行十万遍耗时一样吗

正在起飞的蜗牛

已于 2022-08-27 16:10:13 修改

阅读量737

点赞数

分类专栏： C语言文章标签： C语言

于 2021-07-11 22:17:45 首次发布

本文链接：https://blog.csdn.net/weixin_42031299/article/details/118565909

版权

C语言专栏收录该内容

37 篇文章 36 订阅

订阅专栏

前言

在B站刷视频的时候看到一个视频，讲的是阿里的一道面试题，觉得很兴趣，在此总结一下。原视频链接：https://www.bilibili.com/video/BV1tv411J7Ap。

问题描述

int i = 0;
int length= 64*1024*1024;
int * arr = (int *)molloc(length);

//循环1
for(i = 0; i < length; i++)
{
	arr[i] *=3;
}

//循环2
for(i = 0; i < length; i +=16)
{
	arr[i] *=3;
}

问题：上面两个循环的耗时相差多少？

问题分析：

1.分析：代码中定义了（60 x 1024 x 1024）个成员的数组，循环1是去遍历所有的成员，循环2是访问1/16的成员。如果耗时和访问次数成线性关系，那么循环2的耗时大约是循环1的16倍；如果不是线性关系，那又是什么原因导致了差异。

问题解决的步骤

1.简单粗暴的验证。直接用代码去测试，发现这两个循环的耗时，相差无几，说明耗时和访问次数不是简单的线性关系。现在已经得到了结论，接下来就是找寻理论依据去支撑这个结论。
2.理清影响耗时的因素。运行代码的过程，大致是把数据从内存读到CPU进行处理，然后写回内存。其中CPU的运行速度是远大于内存的运行速度，读取内存会占用大部分的时间。
3.两个循环访问内存的次数会相差16倍吗？很显然不是的，要不然时间就不会相差无几了。原因是cache的存在，cache分为iCache和dCache，不了解的可以参考博客《ARM芯片开发学习（S5PV210）——icache、dcache介绍和如何开关icache》。CPU去访问一次内存，会将一段数据读到cache里，之后需要数据就先去cache里查找，找不到再去读取内存，而不是每次都要去读内存。cache与内存之间的数据交互是缓存行为单位的，x86架构的缓存行是64字节，16个int型变量刚好64字节，无论你需要读取1个int型变量，还是读取16个int型变量，cache和内存都会交互64字节，所以这两者的耗时没有明显区别。
4.补充：这类似于平时写C语言代码里，用char型变量和int型变量其实耗时都差不多。假设现在是32位的机器，int占4字节，char占1字节，但是无论你访问的是char型变量还是int型变量，CPU都会一次读取4字节内容。