在使用python批量读取文件,会存在文件乱序的情况,因为只有数字进行排序,当文件名中出现字母或者下划线时,读取的顺序就会被打乱,这时需要自己排好文件顺序。
if __name__ == '__main__':
train_list = []
filepath = r'../audio_combine/audio_train/'
filePaths = [] # 存储目录下的所有文件名,含完整路径
r = [] # 解决文件顺序混乱时用的列表
for root, dir, files in os.walk(filepath):
for file in files:
f1 = re.findall(r"\d+\.?\d*", file) # 这一段 是为了解决文件乱序问题
f1 = (f1[0], f1[1][:-1])
f1 = list(map(int, f1))
r.append(f1)
re = sorted(r, key=lambda x: (x[0], x[1]))
new_files = [(str(re[i][0]) + '_' + str(re[i][1]) + '.wav') for i in range(len(re))]
for f2 in new_files:
filePaths.append(os.path.join(root, f2)) # 补齐完整路径
for path in filePaths:
print(path)