本篇主要介绍通过Python怎么遍历文件夹。以db3文件为例。
我们使用os.walk()方法来获取所有文件。
os.walk(top, topdown=True, onerror=None, followlinks=False)
os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。
top —是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。
- root 所指的是当前正在遍历的这个文件夹的本身的地址
- dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
- files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)
topdown —可选,为 True,则优先遍历 top 目录,否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为True,walk 会遍历top文件夹,与top 文件夹中每一个子目录。
onerror —可选,需要一个 callable 对象,当 walk 需要异常时,会调用。
followlinks —可选,如果为 True,则会遍历目录下的快捷方式(linux 下是软连接 symbolic link )实际所指的目录(默认关闭),如果为 False,则优先遍历 top 的子目录。
该方法没有返回值。
以本机文件夹里的练习文件为例:
import os
#枚举目录下的所有文件
root_file = 'D:\任务'
paths = [] #用来存放文件路径
for root,dirs,files in os.walk(root_file):
print(root) #当前主目录
print(dirs) #当前主目录下的所有目录
print(files) #当前主目录下的所有文件
for dir in dirs:
print(os.path.join(root,dir)) #合成目录路径
for file in files:
print(os.path.join(rooot,file)) #合成完整路径
另一种写法:
for root,dirs,files in os.walk(root_file):
print(root) #当前主目录
print(dirs) #当前主目录下的所有目录
print(files) #当前主目录下的所有文件
for name in files: #在遍历出的文件里查找符合名字要求的文件
if name == 'SpiderResult.db3':
path = os.path.join(root, name) #合并成一个完整路径
paths.append(path) #整合所有符合条件的文件