原文地址:http://hi.baidu.com/qfans/blog/item/a599a40fe395aeeeab6457cc.html
关于数组遍历,其实很多人都做过测试了,像http://www.lilov.org/post/18.html这样,不过这些讨论其实还是太简单,在这里我将更全面的讨论一下这个问题,虽然看起来有点吹毛求疵,不过做程序就应该抱着这种思想,不断的精益求精~不是么:cool:。
首先,数组遍历的方式for、while、foreach不再多说了,不知道的可以自己去PHP官方查手册,但是for、while、foreach遍历数组的写法也有不同,那么效果呢,接着看就知道咯~
测试环境:
CPU:Athlon XP 2900+
内存:1GB
硬盘:西捷 7200.7
OS:Windows XP SP2
WEB:apache 2.0.55 php4.4.1 php5.0.5 php5.1.1
程序改自上面那个链接中Lilov所写的程序,具体内容可以下载测试源文件改名为array_check.php后就可以运行
测试一:PHP4.4.1下,使用一维数组
-
$mutli_level = false;
结果:
编号 | 语句 | 时间 |
1 | for($i = 0; $i < $num = count($arr); $i++) | 0.1048162(s) |
2 | for($i = 0, $num = count($arr); $i < $num; $i++) | 0.0698998(s) |
3 | while(list($key, $val) = each($arr)) | 0.1437800(s) |
4 | while(list(, $val) = each($arr)) | 0.1226320(s) |
5 | while(list($key, ) = each($arr)) | 0.1119628(s) |
6 | foreach($arr as $key => $val) | 0.0972550(s) |
7 | foreach($arr as $val) | 0.0649691(s) |
可以看出7最快,不过这种方式不会返回下标,如果需要使用下标这种方法就不符合要求了。
其次是2,看出来这种写法和1有什么不同了么?2在循环前计算数组的长度,而1每次循环都要计算数组的长度所以2比1更高效。不过2和1都是一样的,只能操作那种下标是数字而且数字连续的数组。
第三是6,也就是一般讨论中认为最快的方法,如果你操作数组的下标同时下标有是非连续数字那么毫无疑问应该选择这个方法,至于慢的就不多说了,忘记这些用法吧:roll:
测试二:PHP4.4.1下,使用二位数组
-
$mutli_level = true;
结果:
编号 | 语句 | 时间 |
1 | for($i = 0; $i < $num = count($arr); $i++) | 0.0824819(s) |
2 | for($i = 0, $num = count($arr); $i < $num; $i++) | 0.0523129(s) |
3 | while(list($key, $val) = each($arr)) | 0.1273971(s) |
4 | while(list(, $val) = each($arr)) | 0.0961161(s) |
5 | while(list($key, ) = each($arr)) | 0.1245570(s) |
6 | foreach($arr as $key => $val) | 0.0764248(s) |
7 | foreach($arr as $val) | 1.1415598(s) |
结果发生了重大变化
最快的是2,因为for并不会管多维的问题,所以和一维数组时相比速度并没有发生太大的变化(至于为什么比一维还快,这个我只能说受文件中运算的影响....这种影响的而且确存在,用PEAR的Benchmark类测试的时候我就发现测试1次、100次、1000次得到的时间差别很大)
其次是6,同测试一中所说,如果2不能用(也就是下标不连续),6毫无疑问是最好的选择
而令人跌破眼镜的是7,竟然是最慢的,而且比第二慢的还要慢10倍...这个问题实在令人费解,后来我又做过比较细致的测试,发现7这种方法,主要受元素个数的影响,如果一维10个元素,那么如果第二维都有8个元素则7的速度和6几乎一样,如果一维30个元素,那么二维是6个元素时7和6速度基本一样。但是如果一维1000个元素二维元素超过3个那么7就会比6慢很多了。
PHP4.4.1下的总结:
- 当你要操作的数组是一个一维数组而且不需要对下标作处理,方法7是最好的选择,当然这种情况是比较少见的,如果你要操作的是一个多维数组,那么最好用6,即使你不需要处理下标。当然如果你可以预期得到的数组各维元素都不多那么7方法也可以使用。
- 如果你操作的是一个下标为连续数字的数组,2是最好的选择,实际上这个方法经常会在数据库查询中用到,像论坛等等。同时忘记1那种用法吧,它没有使用的价值了。
- 如果你要处理的数组无法满足上面那两种特殊要求,那么就用方法6,这个方法虽然不是最好,但是最通用,一定要记住。
好了,PHP4.4.1讨论完了,接下来我们看看在PHP5.0.5会得到什么结果
测试三:PHP5.0.5下,使用一维数组
-
$mutli_level = false;
结果:
编号 | 语句 | 时间 |
1 | for($i = 0; $i < $num = count($arr); $i++) | 0.0997250(s) |
2 | for($i = 0, $num = count($arr); $i < $num; $i++) | 0.0835171(s) |
3 | while(list($key, $val) = each($arr)) | 0.1477790(s) |
4 | while(list(, $val) = each($arr)) | 0.1345611(s) |
5 | while(list($key, ) = each($arr)) | 0.1173210(s) |
6 | foreach($arr as $key => $val) | 0.1071310(s) |
7 | foreach($arr as $val) | 0.0967681(s) |
和PHP4.4.1下完全不同,速度最快的几位是2>7>1>6,PHP5和4的差别不光是函数使用问题,还有函数的速度,不过话说1早在很久之前就已经被2扔进了历史中了,所以虽然我测试大部分时间1会比6快那么一点,但是实际结论是2>7>6。至于各方法的使用范围在PHP4.4.1里面提到过了,不再复述。
测试四:PHP5.0.5下,使用二维数组
-
$mutli_level = true;
结果:
编号 | 语句 | 时间 |
1 | for($i = 0; $i < $num = count($arr); $i++) | 0.0772181(s) |
2 | for($i = 0, $num = count($arr); $i < $num; $i++) | 0.0513330(s) |
3 | while(list($key, $val) = each($arr)) | 0.1855030(s) |
4 | while(list(, $val) = each($arr)) | 0.0906842(s) |
5 | while(list($key, ) = each($arr)) | 0.1147029(s) |
6 | foreach($arr as $key => $val) | 0.0748529(s) |
7 | foreach($arr as $val) | 0.0629039(s) |
结果是速度2>7>6>1,这次7终于没有发挥失常,实际上我测试1和6的显示的时间基本上是互相交替的可以算是速度一样,又因为2的原因可以得出结论2>7>6。
PHP5.0.5下的总结:
这个简单了,两次得出的结论都是2>7>6,所以很好办咯
- 如果你要操作的数组是具有连续下标的,那么使用2。
- 如果要处理非连续数字下标的数组,但是操作不需要处理下标,那么选择7。
- 如果是一般性的的数组,那就6咯。
最后:
关于实际的执行时间,因为软硬件环境不同,肯定会不一样,不过函数间比较的话这个是可以参考的
每次运行时间也肯定会有误差,这里给出的是我感觉比较接近平均值的数字,同时我也用BEAR的BENCHMARK做过同样的测试,那是用一个较小的数组,运行1000次遍历取平均值,也作过更多维,或者更多项的类似测试,得到的结论和上面相同(这些方法就不细述了),所以说这里得到的结论应该是属实的。
说一句和数组无关的话,从上面可以看出来,PHP5比PHP4的函数算法要更强壮,在不同的环境下,同一个函数执行效率不会变化太大,但是PHP4却有可能像7那样随环境不同发生天差地别的变化,从这方面讲PHP5毫无疑问比PHP4要更优秀,不过现在要完全面向PHP5为时尚早,毕竟空间商还是以PHP4为主,而目前的各种程序也都可能会有不兼容PHP5的情况发生,而且很多程序在PHP4下会比在PHP5下更快,不过作为一种语言,PHP5的优势的确还是很明显,虽然现在我们还是应该考虑到兼容问题,但是未来肯定会选择更好的那个。希望PHP5普及的时间不会太长久~
2005年12月5日补充:
我在《或许5系列普及的日子不会太遥远了》中写道PHP5.1.1比4.4.*和5.0.*要快,所以特别用这个函数测试了一下PHP5.1.1,发现确实5.1.1比原来的版本都要快,而且快很多,然后呢,速度顺序又发生了变化,直接贴出结果:
操作一维数组:
编号 | 语句 | 时间 |
1 | for($i = 0; $i < count($arr); $i++) | 0.0747912(s) |
2 | for($i = 0, $num = count($arr); $i < $num; $i++) | 0.0547030(s) |
3 | while(list($key, $val) = each($arr)) | 0.0986650(s) |
4 | while(list(, $val) = each($arr)) | 0.0978050(s) |
5 | while(list($key, ) = each($arr)) | 0.0908270(s) |
6 | foreach($arr as $key => $val) | 0.0440340(s) |
7 | foreach($arr as $val) | 0.0429142(s) |
操作二维数组:
编号 | 语句 | 时间 |
1 | for($i = 0; $i < count($arr); $i++) | 0.0534339(s) |
2 | for($i = 0, $num = count($arr); $i < $num; $i++) | 0.0307930(s) |
3 | while(list($key, $val) = each($arr)) | 0.0774698(s) |
4 | while(list(, $val) = each($arr)) | 0.0797851(s) |
5 | while(list($key, ) = each($arr)) | 0.0893569(s) |
6 | foreach($arr as $key => $val) | 0.0281241(s) |
7 | foreach($arr as $val) | 0.0224431(s) |
新的结果7>6>2,foreach全面超过for,5.1的核心优化真是厉害,看来论坛的算法要改改了,没有必要再用for了,foreach可以更快,哈,后来又用PEAR的bechmark组件测试了一下,这次我选择的是[30][20]的二维数组,执行5000次,发现其实foreach和for之间速度的差别几乎可以当作误差忽略不计,总的来看实际应用中选择这两个方法的哪一个都是不错的选择,foreach的两种形式之间的差别也是微乎其微,完全不用再顾虑其他问题,根据需要选用就可以了。