Python遍历文件夹的两种方法比较

最新推荐文章于 2024-07-24 04:37:03 发布

weixin_39769379

最新推荐文章于 2024-07-24 04:37:03 发布

阅读量2.1k

点赞数

文章标签： python 遍历文件操作

模块os中的walk()函数可以遍历文件夹下所有的文件。

[python]view plain copy 
   
 os.walk(top, topdown=Ture, οnerrοr=None, followlinks=False)  

该函数可以得到一个三元tupple(dirpath, dirnames, filenames).

参数含义：

dirpath：string，代表目录的路径；
dirnames：list，包含了当前dirpath路径下所有的子目录名字（不包含目录路径）；
filenames：list，包含了当前dirpath路径下所有的非目录子文件的名字（不包含目录路径）。

注意，dirnames和filenames均不包含路径信息，如需完整路径，可使用os.path.join(dirpath, dirnames)

下面给出代码;

[python]view plain copy 
   
 # -*- coding: utf-8 -*-   
   
 import os  
   
 def file_name(file_dir):   
     for root, dirs, files in os.walk(file_dir):  
         print(root) #当前目录路径  
         print(dirs) #当前路径下所有子目录  
         print(files) #当前路径下所有非目录子文件  

当需要特定类型的文件时，代码如下：

[python]view plain copy 
   
 # -*- coding: utf-8 -*-   
   
 import os  
   
 def file_name(file_dir):   
     L=[]   
     for root, dirs, files in os.walk(file_dir):  
         for file in files:  
             if os.path.splitext(file)[1] == '.jpeg':  
                 L.append(os.path.join(root, file))  
     return L  

os.listdir()函数得到的是仅当前路径下的文件名，不包括子目录中的文件，所有需要使用递归的方法得到全部文件名。

直接给出代码，函数将返回类型为‘.jpeg’个文件名：

[python]view plain copy 
   
 # -*- coding: utf-8 -*-  
 import os  
   
 def listdir(path, list_name):  
     for file in os.listdir(path):  
         file_path = os.path.join(path, file)  
         if os.path.isdir(file_path):  
             listdir(file_path, list_name)  
         elif os.path.splitext(file_path)[1]=='.jpeg':  
             list_name.append(file_path)  

遍历文件夹是一个很常用的功能吧。这里分别用两种方法实现：

第一种：使用os.walk:

 
 # -*- coding: utf-8 -*- 
import os 
def Test1(rootDir): 
    list_dirs = os.walk(rootDir) 
    for root, dirs, files in list_dirs: 
        for d in dirs: 
            print os.path.join(root, d)      
        for f in files: 
            print os.path.join(root, f)

第二种：使用os.listdir:

 
 # -*- coding: utf-8 -*- 
import os 
def Test2(rootDir): 
    for lists in os.listdir(rootDir): 
        path = os.path.join(rootDir, lists) 
        print path 
        if os.path.isdir(path): 
            Test2(path)

这两种到底有什么区别呢？

这里先建立一个测试目录E:\test，目录结构如下：

 
 E:\TEST 
│--A 
│  │--A-A 
│  │  │--A-A-A.txt 
│  │--A-B.txt 
│  │--A-C 
│  │  │--A-B-A.txt 
│  │--A-D.txt 
│--B.txt 
│--C 
│  │--C-A.txt 
│  │--C-B.txt 
│--D.txt 
│--E

下面通过运行如下代码：

 
 Test1('E:\TEST') 
print '=======================================' 
Test2('E:\TEST')

输出结果为：

 
 >>>  
E:\TEST\A 
E:\TEST\C 
E:\TEST\E 
E:\TEST\B.txt 
E:\TEST\D.txt 
E:\TEST\A\A-A 
E:\TEST\A\A-C 
E:\TEST\A\A-B.txt 
E:\TEST\A\A-D.txt 
E:\TEST\A\A-A\A-A-A.txt 
E:\TEST\A\A-C\A-B-A.txt 
E:\TEST\C\C-A.txt 
E:\TEST\C\C-B.txt 
======================================= 
E:\TEST\A 
E:\TEST\A\A-A 
E:\TEST\A\A-A\A-A-A.txt 
E:\TEST\A\A-B.txt 
E:\TEST\A\A-C 
E:\TEST\A\A-C\A-B-A.txt 
E:\TEST\A\A-D.txt 
E:\TEST\B.txt 
E:\TEST\C 
E:\TEST\C\C-A.txt 
E:\TEST\C\C-B.txt 
E:\TEST\D.txt 
E:\TEST\E 
>>>

可以看出，对于第一种方法，输出总是先文件夹后文件名的，对于第二种，则是按照目录树结构以及按照首字母排序进行输出的。

另外之前打印出的目录树其实就是通过对第二种方法进行稍微修改实现的，如下：

 
 def Test3(rootDir, level=1): 
    if level==1: print rootDir 
    for lists in os.listdir(rootDir): 
        path = os.path.join(rootDir, lists) 
        print '│  '*(level-1)+'│--'+lists 
        if os.path.isdir(path): 
            Test3(path, level+1)