一个函数“os.walk()”递归拿到多级文件夹的数据
os.walk() 方法
https://www.runoob.com/python/os-walk.html
这个是菜鸟教程的,个人感觉不是很好用
通常在处理数据的时候可能有多级文件夹,文件夹里面又又多个文件。
类似于
os.listdir()方法
有的人喜欢用这个"os.listdir()"
os.listdir(path)
参数
path -- 需要列出的目录路径
返回值
返回指定路径下的文件和文件夹列表。
这个只能返回当前文件夹的文件,多级文件夹并不适用.
示例:
import os
path = r'D:\work\010code\lsb\train_data'
dirs = os.listdir( path )
print(dirs)
结果
os.walk()示例
个人比较喜欢“os.walk()”
语法
walk()方法语法格式如下:
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
参数
top -- 是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。
root 所指的是当前正在遍历的这个文件夹的本身的地址
dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)
topdown --可选,为 True,则优先遍历 top 目录,否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为 True,walk 会遍历top文件夹,与top 文件夹中每一个子目录。
onerror -- 可选,需要一个 callable 对象,当 walk 需要异常时,会调用。
followlinks -- 可选,如果为 True,则会遍历目录下的快捷方式(linux 下是软连接 symbolic link )实际所指的目录(默认关闭),如果为 False,则优先遍历 top 的子目录。
返回值
返回生成器。
示例代码:“注只要你是需要获取某个文件夹下面所有文件路径的都可以使用此函数”
import os
def get_files_path(files_path,file_lists):
for root, dirs, files in os.walk(files_path):
for dir in dirs:
dir_path = os.path.join(root,dir)
for file in files:
file_path = os.path.join(root, file)
file_lists.append(file_path)
if __name__ == '__main__':
files_path = r'D:\work\010code\lsb\train_data\temp'
file_lists = []
get_files_path(files_path,file_lists)
print(file_lists)