Python glob模块

转账

glob模块

功能描述:glob模块可以使用Unix shell风格的通配符匹配符合特定格式的文件和文件夹,跟windows的文件搜索功能差不多。glob模块并非调用一个子shell实现搜索功能,而是在内部调用了os.listdir()和fnmatch.fnmatch()。


glob模块共包含以下3个函数:

  1. glob(pathname, recursive=False) 
    第一个参数pathname为需要匹配的字符串。(该参数应尽量加上r前缀,以免发生不必要的错误) 
    第二个参数代表递归调用,与特殊通配符“**”一同使用,默认为False。 
    该函数返回一个符合条件的路径的字符串列表,如果使用的是Windows系统,路径上的“\”符号会自动加上转义符号变为“\\”(方便使用)。 
    在3.5版本之后,glob函数支持一个特殊的通配符“**”,该通配符可以匹配指定路径里所有文件和目录,包括子目录里的所有文件和目录。相当于递归地调用了这个函数。使用这个通配符必须加上recursive=True参数。 
    在有复杂目录结构的情况下使用该通配符可能会导致性能下降,拖累整个程序的运行,需谨慎使用!

  2. iglob(pathname, recursive=False) 
    参数与glob()一致。 
    返回一个迭代器,该迭代器不会同时保存所有匹配到的路径,遍历该迭代器的结果与使用相同参数调用glob()的返回结果一致。

  3. escape(pathname) 
    这个函数是在3.4版本之后才有的,功能是忽略所有通配符。(可以用于测试某文件是否存在) 
    3.5.1版本该函数不能正常运行,升级到3.5.2之后恢复正常


需要注意的地方:

glob默认不匹配以点符号(.)开始的文件,如果有这类文件,则需要做特殊处理。

假如当前文件夹包含test.txt和.test.txt两个文件。

>>> import glob
>>> glob.glob('*.txt')
['test.txt']
>>> glob.glob('.*.txt')
['.test.txt']
  • 1
  • 2
  • 3
  • 4
  • 5

glob模块支持的通配符:

通配符功能
*匹配0或多个字符
**匹配所有文件、目录、子目录和子目录里的文件(3.5版本新增)
?匹配1个字符,与正则表达式里的?不同
[exp]匹配指定范围内的字符,如:[1-9]匹配1至9范围内的字符
[!exp]匹配不在指定范围内的字符

总结:虽然glob模块可以很轻松地匹配特定文件和文件夹,但是仅仅支持少量的通配符,没办法像正则表达式一样匹配更复杂的字符串。使用的时候应当认真考虑使用场景,根据需求针对性地选择解决方案。


官方文档地址: 
https://docs.python.org/3.5/library/glob.html#module-glob 
感谢内容提供者

以上内容遵循BY-NC-SA协议,欢迎转载,转载请注明作者。

版权声明:以上内容遵循CC BY-NC-SA协议(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh),欢迎转载,转载请注明作者。 https://blog.csdn.net/jy692405180/article/details/52245829
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值