本文中,我们将基于glob.glob()及其内置参数“recursive”,用一行代码实现对某个目录及其子目录下所有指定文件的获取。
1. glob.glob函数介绍
glob.glob()主要用于找到符合特定规则的文件路径名,详情请参考官方文档:
https://docs.python.org/3/library/glob.html
glob.glob(pathname, *, root_dir=None, dir_fd=None, recursive=False, include_hidden=False)
2. 问题描述及解决方法
如,我们要在目录 “C:\Users\Leo\Desktop\ 中找到该目录及其子目录下所有的.txt文件。
search_path = "C:\\Users\\Leo\\Desktop"
file_name = "*.txt"
若我们直接将search_path与file_name相连,glob.glob将仅输出search_path本目录下的.txt文件,而不包括子目录下的.txt文件。
files = glob.glob(pathname = search_path + "\\" + file_name, recursive=True)
# files将仅输出search_path目录下的所有.txt文件。
print(files)
为解决这个问题,合理使用glob.glob()的关键参数为“recursive”。
如果我们将recursive = True,且在serach_path和file_name之间添加“\\”**,则glob.glob将遍历search_path及其所有子目录获得所有的.txt文件:
files = glob.glob(pathname = search_path + "\\**\\" + file_name, recursive=True)
# files将输出search_path及其子目录下的所有.txt文件。
print(files)