利用Python glob模块读取指定目录下的指定类型文件列表

利用Python glob模块读取指定目录下的指定类型文件列表

作者:戴翔的技术博客
文章链接:使用python读取指定目录下的指定类型文件

功能描述:glob模块可以使用Unix shell风格的通配符匹配符合特定格式的文件和文件夹,跟windows的文件搜索功能差不多。glob模块并非调用一个子shell实现搜索功能,而是在内部调用了os.listdir()和fnmatch.fnmatch()。

glob模块共包含以下3个函数:

glob(pathname, recursive=False)

第一个参数pathname为需要匹配的字符串。(该参数应尽量加上r前缀,以免发生不必要的错误)
第二个参数代表递归调用,与特殊通配符“”一同使用,默认为False。
该函数返回一个符合条件的路径的字符串列表,如果使用的是Windows系统,路径上的“\”符号会自动加上转义符号变为“\”(方便使用)。
在3.5版本之后,glob函数支持一个特殊的通配符“
”,该通配符可以匹配指定路径里所有文件和目录,包括子目录里的所有文件和目录。相当于递归地调用了这个函数。使用这个通配符必须加上recursive=True参数。
(在有复杂目录结构的情况下使用该通配符可能会导致性能下降,拖累整个程序的运行,需谨慎使用!)

iglob(pathname, recursive=False)

参数与glob()一致。
返回一个迭代器,glob方法返回的是一个匹配所有路径的列表。该迭代器不会同时保存所有匹配到的路径,遍历该迭代器的结果与使用相同参数调用glob()的返回结果一致。

escape(pathname)

这个函数是在3.4版本之后才有的,功能是忽略所有通配符。(可以用于测试某文件是否存在)
(3.5.1版本该函数不能正常运行,升级到3.5.2之后恢复正常)

需要注意的地方:

glob默认不匹配以点符号(.)开始的文件,隐藏类文件,如果有这类文件,则需要做特殊处理。

假如当前文件夹包含test.txt和.test.txt两个文件。

import glob
glob.glob(’*.txt’)
[‘test.txt’]

glob.glob(’.*.txt’)
[’.test.txt’]
1
2
3
4
5
glob模块支持的通配符:

通配符

通配符功能
*匹配0或多个字符
**匹配所有文件、目录、子目录和子目录里的文件(3.5版本新增)
?匹配1个字符,与正则表达式里的?不同
[exp]匹配指定范围内的字符,如:[1-9]匹配1至9范围内的字符
[!exp]匹配不在指定范围内的字符

总结:虽然glob模块可以很轻松地匹配特定文件和文件夹,但是仅仅支持少量的通配符,没办法像正则表达式一样匹配更复杂的字符串。使用的时候应当认真考虑使用场景,根据需求针对性地选择解决方案。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值