查阅相关博客,使用os.walk方法完成目标路径下文件的遍历。
得知os.walk与os.path.walk主要区别在于,os.path.walk可直接将使用遍历路径的结果的函数作为参数来回调使用,同时os.walk返回的结果文件和子目录是分开的,而os.path.walk将子目录和文件名混在一起,使用时需加判断。
参看博客 python os.walk()和os.path.walk()
为了便于直接使用文件名,暂时选用os.walk遍历目的路径,
os.walk返回的元组的三个元素分别是:当前遍历的路径名(字符串)、当前路径下含有的子目录列表、当前遍历的文件名列表
代码如下
for dir_path, subpaths, files in os.walk(top_dir, False):
files_tag = files[:]
for key in files:
# 将当前遍历路径与上一次遍历路径比较是否不同,是则将路径列表增加,修改excel工作表表名称为遍历路径名,其中/替换为_方可写入
if path_lis[-1] != dir_path:
i = files_tag.index(key)
# 更换遍历路径时,副本列表做标记
files_tag[i] = '下一个工作表'
# 路径名列表不断从尾部增加当前遍历路径名
path_lis.append(dir_path)
# 路径名的‘/’不能出现在工作表名称中
sh_name = path_lis[-1].replace('/', '_')
# 路径名较长,前面的路径名基本一样,有价值的在最后一部分,便于区分和验证
book_name = sh_name[-15::1]
excel_wr.add_sheet(book_name)
excel_wr.save('/mnt/hgfs/xxx/xxx.xls')
此处path_lis作为临时存储遍历的路径名列表,files_tag作为文件名列表的副本,当前路径名变更时,在此副本列表标记,每次更换路径名时,添加一张以当前路径名最后15个字符为名的工作表,便于区分。
此方式生成的工作表,仍需完善