python之文件和文件夹的遍历
1、os.listdir()
os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。这个列表以字母顺序。 它不包括 ‘.’ 和’…’ 即使它在文件夹中。
需要和os.path.join配合使用
import os
input_dir =r""
files=os.listdir(input_dir)
for file in files:
file_path = os.path.join(input_dir,file)
if os.path.isdir(file_path):
print("it's a directory")
if os.path.isfile(file_path):
print("it's a normal file")
2、glob.glob()
glob.glob()可以用于返回指定条件的文件
import os
import glob
input_dir = r""
tiff_files = glob.glob(os.path.join(input_dir,"*.tif") #返回全部的tif文件
3、os.walk()
os.walk()函数返回的是一个包含当前根目录路径、当前路径下的文件夹列表和文件列表的生成器。os.walk()比前两个方法相对复杂一点,但是对于多层的文件搜索更有用。
图中可以看到test_walk文件夹下有两个文件夹(test_1和test_2)和3个tif文件,test_1文件夹下有6个文件,test_2下有4个文件
import os
input_dir=r"D:\test_walk"
for root,dir,list in os.walk(input_dir):
print(root)
print(dir)
print(list)
输出结果
从输出结果中可以看出os.walk()是逐层进行遍历文件夹的。
第一次访问:
当前路径为D:\test_walk,当前路径下文件夹为test_1、test_2,当前路径下文件6个tif文件,
第二次访问:
进入test_1文件夹,根路径为:D:\test_walk\test_1,没有文件夹,返回一个空列表,有几个shape文件。
第三次访问
进入test_2文件夹,根路径为:D:\test_walk\test_2,没有文佳佳,返回空列表,有两个tif文件,1个xml文件,1个txt文件
如果想用os.walk找出所有的tif文件该怎么做呢
import os
input_dir=r"D:\test_walk"
for root,dir,list in os.walk(input_dir):
for file in list:
file_extension = file.split(".")
if file_extension[-1]=="tif":
tif_path =os.path.join(root,file)
结果:搜索结果中包括了根目录下的3个tif文件和test_2目录下的两个tif文件