Python glob的使用及glob.glob的排序问题

本文详细介绍了Python中的glob模块,该模块用于查找符合特定规则的文件路径名。文章讲解了如何使用通配符如*?和[]来匹配文件路径,并展示了如何结合这些通配符进行更复杂的搜索。此外,还讨论了glob.glob函数的排序问题及解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介:

     glob是python自带的一个操作文件的相关模块,由于模块功能比较少,所以很容易掌握。用它可以查找符合特定规则的文件路径名。使用该模块查找文件,只需要用到:"*","?","[]"这三个匹配符

  1. 星号"*"匹配0个或多个字符

  2. 问号"?"匹配任何单个字符

  3. "[]"匹配指定范围内的一个特定字符,如:[0-9]匹配范围内数字,[a-z]和[A-Z]匹配范围内字母

一、glob.glob:

     返回所有匹配的文件路径列表。它只有一个参数pathname,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径。

1、通配符

星号"*"匹配0个或多个字符

import glob
path = glob.glob('C:/Users/huangzh/Desktop/dir/*.txt')
print(path)
"""
结果:
[C:/Users/huangzh/Desktop/dir\\file.txt, C:/Users/huangzh/Desktop/dir\\file1.txt, C:/Users/huangzh/Desktop/dir\\file2.txt, C:/Users/huangzh/Desktop/dir\\fileA.txt, C:/Users/huangzh/Desktop/dir\\fileB.txt]
"""

上级目录也可以用星号替代

import glob
path = glob.glob('C:/Users/huangzh/Desktop/*/*.*')
for file in path:
    print(file)
"""
结果:
C:/Users/huangzh/Desktop\dir\file.txt
C:/Users/huangzh/Desktop\dir\file1.txt
C:/Users/huangzh/Desktop\dir\file2.txt
C:/Users/huangzh/Desktop\dir\fileA.txt
C:/Users/huangzh/Desktop\dir\fileB.txt
"""

2、单个字符通配符

问号"?"匹配任何单个字符

import glob
path = glob.glob('C:/Users/huangzh/Desktop/dir/file?.txt')
for file in path:
    print(file)
"""
结果:
C:/Users/huangzh/Desktop/dir\file1.txt
C:/Users/huangzh/Desktop/dir\file2.txt
C:/Users/huangzh/Desktop/dir\fileA.txt
C:/Users/huangzh/Desktop/dir\fileB.txt
"""

3、字符范围

"[]"匹配指定范围内的一个特定字符,如:[0-9]匹配范围内数字,[a-z]和[A-Z]匹配范围内字母

import glob
path = glob.glob('C:/Users/huangzh/Desktop/dir/file[0-9].txt')
for file in path:
    print(file)
"""
结果:
C:/Users/huangzh/Desktop/dir\file1.txt
C:/Users/huangzh/Desktop/dir\file2.txt
"""

path = glob.glob('C:/Users/huangzh/Desktop/dir/file[A-Z].txt')
for file in path:
    print(file)
"""
结果:
C:/Users/huangzh/Desktop/dir\fileA.txt
C:/Users/huangzh/Desktop/dir\fileB.txt
"""

一起使用

import glob
path = glob.glob('C:/Users/huangzh/Desktop/dir/*?.t[a-z]t')
for file in path:
    print(file)
"""
结果:
C:/Users/huangzh/Desktop/dir\file.txt
C:/Users/huangzh/Desktop/dir\file1.txt
C:/Users/huangzh/Desktop/dir\file2.txt
C:/Users/huangzh/Desktop/dir\fileA.txt
C:/Users/huangzh/Desktop/dir\fileB.txt
"""

二、glob.glob的排序问题

对按顺序生成的文件glob.glob是这样排序的:

import glob
path = glob.glob('C:/Users/huangzh/Desktop/dir/*.txt')
for file in path:
    print(file)
"""
结果:
C:/Users/huangzh/Desktop/dir\file1.txt
C:/Users/huangzh/Desktop/dir\file10.txt
C:/Users/huangzh/Desktop/dir\file100.txt
C:/Users/huangzh/Desktop/dir\file1000.txt
C:/Users/huangzh/Desktop/dir\file2.txt
C:/Users/huangzh/Desktop/dir\file3.txt
"""

显然这不是理想的顺序,甚至会影响结果

所以,可以用sorted进行排序

1、按生成时间排序:

import glob
import os
path = glob.glob('C:/Users/huangzh/Desktop/dir/*.txt')
print(sorted(path, key = os.path.getctime))
"""
结果:
['C:/Users/huangzh/Desktop/dir\\file1.txt', 'C:/Users/huangzh/Desktop/dir\\file2.txt', 'C:/Users/huangzh/Desktop/dir\\file3.txt', 'C:/Users/huangzh/Desktop/dir\\file10.txt', 'C:/Users/huangzh/Desktop/dir\\file100.txt', 'C:/Users/huangzh/Desktop/dir\\file1000.txt']
"""

2、按大小排序:

import glob
import os
path = glob.glob('C:/Users/huangzh/Desktop/dir/*.txt')
sorted(path, key = os.path.getsize)

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值