1,搜索文件,文件过滤
这里使用:pathlib 模块的 Path.glob(pattern) 方法,该方法可以用来过滤目标文件,以迭代器的形式返回搜索结果。
pattern: 通配符:
"*.py":搜索指定目录下所有的py后缀文件,只搜索当前目录,不搜索子目录。
"**/*.py":搜索指定目录下所有的py后缀文件,包括子目录。"**
" 模式表示 “此目录以及所有子目录,递归”。换句话说,它启用递归通配:
文件名可以使用以下符号组合进行模式匹配:
" * " 匹配0个或多个字符
" ? " 仅匹配一个字符
" [] " 匹配指定范围内的字符,如[0-9]匹配数字
2,用法:
1,只遍历当前目录
import pathlib
# 构建一个pathlib.Path()对象
# 指定一个目录起始点:"F:/path_test"
p = pathlib.Path("F:/path_test")
# 遍历 F:/path_test目录下,所有的 py 文件
# 只遍历当前目录
ret = p.glob("*.py")
for item in ret:
print(item)
""" 运行结果
F:\path_test\01.py
F:\path_test\02.py
"""
2,递归遍历
# ......
# 遍历 F:/path_test目录及子目录下 所有的 py 文件
# 递归遍历所有子目录
ret = p.glob("**/*.py")
for item in ret:
print(item)
""" 运行结果
F:\path_test\01.py
F:\path_test\02.py
F:\path_test\src\11.py
F:\path_test\src\22.py
"""
3,Path.rglob() 递归遍历
# ......
# 遍历 F:/path_test目录及子目录下 所有的 py 文件
# 递归遍历所有子目录
# 这就像调用 Path.glob()时,通配符 pattern 前面添加了 "**/" 一样
ret = p.rglob("*.py")
for item in ret:
print(item)
""" 运行结果
F:\path_test\01.py
F:\path_test\02.py
F:\path_test\src\11.py
F:\path_test\src\22.py
"""
缺点:当目录树较大时,Path.glob() 耗时较长。