代码在:0901_getDataOfAidatatang_200zh
1. os.walk()
1.1 说明
文件目录如下:
目的:想要保留子文件中所有的wav
后缀的音频文件。
思路:删除所有其它非wav
后缀的文件。
1.2 先看一看os.walk
的用法
data_path = '/Users/robin/Desktop/aidatatang_200zh'
lst = ['metadata', 'trn', 'txt'] # 需要删除的后缀文件
for root, dirs, files in os.walk(data_path):
print(root)
print()
- root 的结果:
/Users/robin/Desktop/aidatatang_200zh
/Users/robin/Desktop/aidatatang_200zh/voiceprint
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus/train
/Users/robin/Desktop/aidatatang_200zh/voiceprint/corpus/train/G0002
可以看到 os.walk 返回的第一个值 root
是每一次向下游走的目录路径
- dirs 的结果:
['voiceprint']
['corpus']
['train']
['G0002']
[]
dirs
是 os.walk 返回值(元组)的第二个值,其表示的是每一个目录层级的文件夹名称
- files 的结果:
['.DS_Store']
['.DS_Store']
['.DS_Store']
['.DS_Store']
['T0055G0002S0002.txt', 'T0055G0002S0001.trn', 'T0055G0002S0001.wav', 'T0055G0002S0002.trn', 'T0055G0002S0001.txt', 'T0055G0002S0002.wav', '.DS_Store', 'T0055G0002S0002.metadata', 'T0055G0002S0001.metadata']
files
是返回值的第三个值,表示的是每一个目录层级下所有的文件的名称('.DS_Store'
是Mac的隐藏文件)
2. 应用:删除某文件夹下除了 wav 后缀的其它文件
import os
data_path = '/Users/robin/Desktop/aidatatang_200zh'
lst = ['metadata', 'trn', 'txt'] # 需要删除的后缀文件
for root, dirs, files in os.walk(data_path):
for file in files:
if file[16:] in lst: # 也可以用类似 if(name.endswith("txt")): 的多个if循环来判断
print(file[16:])
# print(os.path.join(root, file)) # 目录路径 + 文件名 = 文件完整地址
os.remove(os.path.join(root, file))
进阶
- 如何分别获取多级文件的名称
for dirpath,dirnames,filenames in os.walk(path):
subdirname=dirpath.split('\\')[-1]
dirclassname=dirpath.split('\\')[-3]
noname=dirpath.split('\\')[-2]
for filename in filenames:
if len(filename)==0:
pass
-
如何指定文件夹?
-
如何指定遍历的顺序?——topdown参数
还有最简单的固定遍历顺序的方法,使用sorted()
,比如,for file in sorted(files)
-
如何指定一定层级的文件夹?(指定遍历深度)
添加链接描述
参考: