PHP遍历目录文件的几种方法效率评析

PHP的确是个好东西啊~~

在谷歌上以“PHP 遍历 目录”为关键字的话,能搜索到将近8W的结果。Rt在这里选取了几种常见的php遍历目录文件的方法,一同比较每种方案的执行效率。

测试环境

CPU: AMD Sempron(闪龙) 双核 2300 2.20GHz

内存:金士顿 DDR2 800MHz 1GB

硬盘:迈拓 6Y080L0 ( 80 GB / 7200 转/分 2M缓存 )

OS: WinXP SP3 + IIS +PHP5 +MYSQL

准备工作

安装好软件环境后,使用以下代码生成50000个测试文件:

(需要将php.ini里的超时时间设置更长)


<?php
for ($i=1; $i<=50000; $i++){
$C_File = fopen($i.".test", 'wb ');
fputs($C_File, $i);
fclose($C_File);
}
echo "OK";
?>

在浏览器中访问该文件,等待输出”OK”后,文件建立完成。


(50000个文件已经建立了)

测试对象

Rt选取了以下几种算法作为测试的对象:
1.简短系

foreach(glob('*.*') as $filename)
{
echo 'Filename:'.$filename.;
}

2.规矩系

if($handle = opendir('C:\\Inetpub\\wwwroot\\test\\')){
echo "Files:\n";
while (false !== ($file = readdir($handle))){
echo "$file\n";
}
closedir($handle);
}

3.函数系


function tree($directory)
{
$mydir=dir($directory);
while($file=$mydir->read()){
if((is_dir("$directory/$file")) AND ($file!=".") AND ($file!=".."))
{
echo "$file\n";
tree("$directory/$file");
}
else
echo "$file\n";
}
echo "\n";
$mydir->close();
}
tree("C:\\Inetpub\\wwwroot\\test\\");

4.函数系II

function listDir($dir){
if(is_dir($dir)){
if ($dh = opendir($dir)) {
while (($file= readdir($dh)) !== false){
if((is_dir($dir."/".$file)) && $file!="." && $file!=".."){
echo "文件名:",$file;
listDir($dir."/".$file."/");
}else{
if($file!="." && $file!=".."){
echo $file;
}
}
}
closedir($dh);
}
}
}
listDir("C:\\Inetpub\\wwwroot\\test\\");

5.递归系

function file_list($dir,$pattern="")
{
$arr=array();
$dir_handle=opendir($dir);
if($dir_handle)
{
while(($file=readdir($dir_handle))!==false)
{
if($file==='.' || $file==='..')
{
continue;
}
$tmp=realpath($dir.'/'.$file);
if(is_dir($tmp))
{
$retArr=file_list($tmp,$pattern);
if(!emptyempty($retArr))
{
$arr[]=$retArr;
}
}
else
{
if($pattern==="" || preg_match($pattern,$tmp))
{
$arr[]=$tmp;
}
}
}
closedir($dir_handle);
}
return $arr;
}
print_r(file_list("C:\\Inetpub\\wwwroot\\test\\"));

测试方法

我们采取在测试代码的头部和尾部添加如下的内容来检测执行时间,并测试5次取平均结果作为最终成绩。

$stime=microtime(true);


$etime=microtime(true);
$total=($etime-$stime)*1000;
echo "{$total} Millisecond(s)";

测试过程

算法1

算法1在浏览器能正确输出所有项目,5次测验耗费的时间分别是:


平均用时=3803.618621824 毫秒 

算法2

算法2在浏览器也能正确输出所有项目,但在开头会给出“..”(上级目录)的信息。5次测验耗费的时间分别是:


平均用时=381.0853481294 毫秒

算法3

算法3在浏览器能正确输出所有项目,也仍会给出“..”(上级目录)的信息。5次测验耗费的时间分别是:


平均用时=24299.2805485 毫秒

算法4

算法4和算法3类似,在浏览器能正确输出所有项目,5次测验耗费的时间分别是:


平均用时=24020.66812516 毫秒

算法5

算法5曾一度让我以为IIS又出问题了。虽说它在浏览器能正确输出所有项目,但数据的结果默认为数组。5次测验耗费的时间分别是:


平均用时=61411.31243706 毫秒

测试总结

根据测试结果,我们很容易得出下面的速度排名。

算法2 > 算法1 > 算法4 >  算法3 > 算法5

为什么算法2要比其他算法都高效一些呢?

实际上是因为算法中只使用了php中内置用来读取目录内容的函数“readdir()” 。除了算法1以外,其他算法在引用readdir()的时候,为了弥补函数的先天不足,干了很多其他的事情。

如果说,我们需要指定扩展名的列举目录内所有文件的话。Rt推荐使用算法1的模式,我们将代码写成这样就可以了。

foreach(glob('*.需要的扩展名') as $filename)
{
echo 'Filename:'.$filename.;
}

结语

不管作为一个代码新手还是一个资深的程序员,在堆砌代码的时候,更应该关注程序的效率和安全。

请不要忽略任何一种可能,也请不要让孩子般的代码成为拖累服务器的罪魁祸首。

代码如诗,写好自己的诗。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值