python中的glob库_浅析python标准库中的glob

glob 文件名模式匹配,不用遍历整个目录判断每个文件是不是符合。

1、通配符

星号(*)匹配零个或多个字符

import glob

for name in glob.glob('dir/*'):

print (name)

dir/file.txt

dir/file1.txt

dir/file2.txt

dir/filea.txt

dir/fileb.txt

dir/subdir

列出子目录中的文件,必须在模式中包括子目录名:

import glob

#用子目录查询文件

print ('Named explicitly:')

for name in glob.glob('dir/subdir/*'):

print ('\t', name)

#用通配符* 代替子目录名

print ('Named with wildcard:')

for name in glob.glob('dir/*/*'):

print ('\t', name)

Named explicitly:

dir/subdir/subfile.txt

Named with wildcard:

dir/subdir/subfile.txt

2、单个字符通配符

用问号(?)匹配任何单个的字符。

import glob

for name in glob.glob('dir/file?.txt'):

print (name)

dir/file1.txt

dir/file2.txt

dir/filea.txt

dir/fileb.txt

3、字符范围

当需要匹配一个特定的字符,可以使用一个范围

import glob

for name in glob.glob('dir/*[0-9].*'):

print (name)

dir/file1.txt

dir/file2.txt

知识点补充:Python编程:glob模块进行文件名模式匹配

文件准备

$ mkdir tmp

$ cd tmp

$ touch file1.txt

$ touch file2.txt

$ touch file3.log

$ ls

file1.txt       file2.txt       file3.log

测试

import glob

# 使用零个或多个字符通配符 *

glob.glob("tmp/*.txt")

Out[1]:

['file1.txt', 'file2.txt']

# 使用单字符通配符 ?

glob.glob("tmp/file?.txt")

Out[2]:

['file1.txt', 'file2.txt']

# 使用范围匹配

glob.glob("tmp/file[0-9].txt")

Out[3]:

['file1.txt', 'file2.txt']

总结

到此这篇关于浅析python标准库中的glob的文章就介绍到这了,更多相关python标准库 glob内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

### Python `glob` 的使用方法 #### 基本功能介绍 `glob` 是 Python 中的一个标准库,主要用于通过模式匹配的方式查找指定路径下的文件或目录。它支持常见的通配符语法,例如 `*`, `?`, `[ ]` 等。 以下是几个常用的参数和方法: - **`glob.glob(pathname, *, recursive=False)`**: 返回所有匹配给定模式的文件路径列表[^5]。 - **`glob.iglob(pathname, *, recursive=False)`**: 返回一个生成器对象,每次调用返回下一个匹配项[^2]。 - 参数说明: - `pathname`: 路径模式字符串,可以包含通配符。 - `recursive`: 如果设置为 `True`,则允许递归搜索子目录中的文件[^3]。 --- #### 示例代码展示 ##### 1. 查找当前目录下所有 `.txt` 文件 ```python import glob # 使用 glob 函数获取所有 .txt 文件 text_files = glob.glob("*.txt") print("Text files in current directory:", text_files) ``` 此示例展示了如何利用 `*` 来匹配任意长度的字符序列。 --- ##### 2. 迭代方式处理匹配结果 如果只需要逐一处理匹配到的结果而不是一次性加载整个列表,则可以使用 `iglob()` 方法: ```python import glob for filepath in glob.iglob("*.py"): print(f"Found Python file: {filepath}") ``` 这种方法相较于 `glob()` 更节省内存资源。 --- ##### 3. 递归搜索子目录 为了更深入地探索文件结构并找到嵌套层次较深的目标文件,可以通过启用 `recursive=True` 实现递归查询: ```python import glob # 查找当前目录及其子目录中所有的 .py 文件 python_files = glob.glob("**/*.py", recursive=True) print("Python files including subdirectories:", python_files) ``` 注意这里的双星号 (`**`) 表达的是零个或者多个目录层。 --- ##### 4. 匹配特定字符集 有时可能希望限定某些具体条件比如扩展名前缀含有数字的情况,这时就可以借助方括号定义合法字符区间: ```python import glob # 找出 dir/ 下以任何单个数字结尾的所有类型文件 special_files = glob.glob("dir/*[0-9].*") for sf in special_files: print(sf) ``` 上述片段解释了怎样运用正则表达式的概念去筛选符合条件的数据集合[^4]。 --- ### 总结 综上所述,无论是简单场景还是复杂需求场合,`glob` 都能提供灵活高效的解决方案来完成基于规则驱动的任务自动化流程设计工作。其核心优势在于简洁直观的同时保持强大表现力,非常适合日常开发过程中涉及批量操作的需求分析阶段快速原型构建环节应用实践当中不断优化改进直至最终部署上线运行维护周期内的各个环节均具有重要意义价值所在之处体现得淋漓尽致。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值