1. glob方法:
glob模块的主要方法就是glob,该方法返回所有匹配的文件路径列表(list);
该方法需要一个参数用来指定匹配的路径字符串(字符串可以为绝对路径也可以为相对路径),其返回的文件名只包括当前目录里的文件名,不包括子文件夹里的文件。
glob是实用的文件名匹配库,glob.glob()函数将会匹配给定路径下的所有pattern,并以列表形式返回。
用它可以查找符合特定规则的文件路径名。类似于正则表达式,但是与正则表达式不完全相同
查找文件只用到三个匹配符:
”*” :匹配 0 个或多个字符;
“?”:匹配单个字符;
“[]”:匹配指定范围内的字符,如:[0-9]匹配数字;
注意:如果文件名以“点”开头 ,无法被 '*' 和 '?'匹配,如:".card.gif"
例子1:
import glob
#获取指定目录下的所有图片
print (glob.glob(r"/home/qiaoyunhao/*/*.png"),"\n")#加上r让字符串不转义
#获取上级目录的所有.py文件
print (glob.glob(r'../*.py')) #相对路径
结果:
例子2:
files = glob.glob('/media/AI/DATA/train' +"/*"):
#解释:获取指定文件夹下的所有文件和文件夹,此时files是一个list列表,包含train文件里面的文件和子文件夹
for xmlPath in glob.glob(xmlPath + "/*/*"):
#解释:遍历指定文件夹下的所有文件夹里的所有文件,/*/*可以根据文件夹层数自主设定
img_path = sorted(glob.glob(os.path.join(images, '*.npy')))
#解释:遍历文件夹下所有npy文件
import glob
#获取指定目录下的所有图片
print glob.glob(r"E:/Picture/*/*.jpg")
#获取上级目录的所有.py文件
print glob.glob(r'../*.py') #相对路径
2. glob.iglob:
获取一个可编历对象,使用它可以逐个获取匹配的文件路径名。与glob.glob()的区别是:glob.glob同时获取所有的匹配路径,而glob.iglob一次只获取一个匹配路径。这有点类似于.NET中操作数据库用到的DataSet与DataReader。下面是一个简单的例子:
import glob
#父目录中的.py文件
f = glob.iglob(r'../*.py')
print f #<generator object iglob at 0x00B9FF80>
for py in f:
print py
import glob #父目录中的.py文件 f = glob.iglob(r'../*.py') print f #<generator object iglob at 0x00B9FF80> for py in f: print py