在谷歌上以“PHP 遍历 目录”为关键字的话,能搜索到将近8W的结果。Rt在这里选取了几种常见的php遍历目录文件的方法,一同比较每种方案的执行效率。
测试环境
CPU: AMD Sempron(闪龙) 双核 2300 2.20GHz
内存:金士顿 DDR2 800MHz 1GB
硬盘:迈拓 6Y080L0 ( 80 GB / 7200 转/分 2M缓存 )
OS: WinXP SP3 + IIS +PHP5 +MYSQL
准备工作
安装好软件环境后,使用以下代码生成50000个测试文件:
(需要将php.ini里的超时时间设置更长)
<?php
for ($i=1; $i<=50000; $i++){
$C_File = fopen($i.".test", 'wb ');
fputs($C_File, $i);
fclose($C_File);
}
echo "OK";
?>在浏览器中访问该文件,等待输出”OK”后,文件建立完成。
测试对象
Rt选取了以下几种算法作为测试的对象:
1.简短系
foreach(glob('*.*') as $filename)
{
echo 'Filename:'.$filename.;
}
2.规矩系
if($handle = opendir('C:\\Inetpub\\wwwroot\\test\\')){
echo "Files:\n";
while (false !== ($file = readdir($handle))){
echo "$file\n";
}
closedir($handle);
}
3.函数系
function tree($directory)
{
$mydir=dir($directory);
while($file=$mydir->read()){
if((is_dir("$directory/$file")) AND ($file!=".") AND ($file!=".."))
{
echo "$file\n";
tree("$directory/$file");
}
else
echo "$file\n";
}
echo "\n";
$mydir->close();
}
tree("C:\\Inetpub\\wwwroot\\test\\");
4.函数系II
function listDir($dir){
if(is_dir($dir)){
if ($dh = opendir($dir)) {
while (($file= readdir($dh)) !== false){
if((is_dir($dir."/".$file)) && $file!="." && $file!=".."){
echo "文件名:",$file;
listDir($dir."/".$file."/");
}else{
if($file!="." && $file!=".."){
echo $file;
}
}
}
closedir($dh);
}
}
}
listDir("C:\\Inetpub\\wwwroot\\test\\");
5.递归系
function file_list($dir,$pattern="")
{
$arr=array();
$dir_handle=opendir($dir);
if($dir_handle)
{
while(($file=readdir($dir_handle))!==false)
{
if($file==='.' || $file==='..')
{
continue;
}
$tmp=realpath($dir.'/'.$file);
if(is_dir($tmp))
{
$retArr=file_list($tmp,$pattern);
if(!emptyempty($retArr))
{
$arr[]=$retArr;
}
}
else
{
if($pattern==="" || preg_match($pattern,$tmp))
{
$arr[]=$tmp;
}
}
}
closedir($dir_handle);
}
return $arr;
}
print_r(file_list("C:\\Inetpub\\wwwroot\\test\\"));
测试方法
我们采取在测试代码的头部和尾部添加如下的内容来检测执行时间,并测试5次取平均结果作为最终成绩。
$stime=microtime(true);
$etime=microtime(true);
$total=($etime-$stime)*1000;
echo "{$total} Millisecond(s)";
测试过程
算法1
算法1在浏览器能正确输出所有项目,5次测验耗费的时间分别是:
算法2
算法2在浏览器也能正确输出所有项目,但在开头会给出“..”(上级目录)的信息。5次测验耗费的时间分别是:
算法3
算法3在浏览器能正确输出所有项目,也仍会给出“..”(上级目录)的信息。5次测验耗费的时间分别是:
算法4
算法4和算法3类似,在浏览器能正确输出所有项目,5次测验耗费的时间分别是:
算法5
算法5曾一度让我以为IIS又出问题了。虽说它在浏览器能正确输出所有项目,但数据的结果默认为数组。5次测验耗费的时间分别是:
测试总结
根据测试结果,我们很容易得出下面的速度排名。
算法2 > 算法1 > 算法4 > 算法3 > 算法5
为什么算法2要比其他算法都高效一些呢?
实际上是因为算法中只使用了php中内置用来读取目录内容的函数“readdir()” 。除了算法1以外,其他算法在引用readdir()的时候,为了弥补函数的先天不足,干了很多其他的事情。
如果说,我们需要指定扩展名的列举目录内所有文件的话。Rt推荐使用算法1的模式,我们将代码写成这样就可以了。
foreach(glob('*.需要的扩展名') as $filename)
{
echo 'Filename:'.$filename.;
}
结语
不管作为一个代码新手还是一个资深的程序员,在堆砌代码的时候,更应该关注程序的效率和安全。
请不要忽略任何一种可能,也请不要让孩子般的代码成为拖累服务器的罪魁祸首。
代码如诗,写好自己的诗。