引入
在实际项目中,常需要批量处理某些文件夹下的子文件夹/文件。因此就需要遍历文件夹下所有的文件。
若只想读取特定的文件,就是在遍历过程中加一个条件判断即可,比如限定只访问特定后缀名的文件。
在python中,可通过os模块的os.walk()
轻松实现对文件夹的遍历。
os.walk()
接口的基本使用:
- 传入参数top,即需要遍历的根文件夹
- 返回结果是一个生成器,可通过for循环去迭代其中的元素,就是一个从上至下的目录树。
Signature: os.walk(top, topdown=True, onerror=None, followlinks=False)
Docstring:
Directory tree generator.
For each directory in the directory tree rooted at top (including top
itself, but excluding '.' and '..'), yields a 3-tuple
dirpath, dirnames, filenames
dirpath is a string, the path to the directory. dirnames is a list of
the names of the subdirectories in dirpath (excluding '.' and '..').
filenames is a list of the names of the non-directory files in dirpath.
Note that the names in the lists are just names, with no path componen