我有一个过程os.walk是一个目录及其子目录,用于筛选pdf文件,并将它们的名称和相应的路径名分开。我遇到的问题是,它将扫描最上面的目录并打印适当的文件名,例如G:/Books/Title.Pdf,但在扫描子文件夹(例如G:/Books/Sub Folder/Title.pdf)时,它将打印以下内容G:/Books/Sub Folder\\Title.Pdf
(这显然是一个无效的路径名)。它还将向子文件夹中的任何子文件夹添加“\”。
程序如下:def dicitonary_list():
indexlist=[] #holds all files in the given directory including subfolders
pdf_filenames=[] #holds list of all pdf filenames in indexlist
pdf_dir_list = [] #holds path names to indvidual pdf files
for root, dirs,files in os.walk('G:/Books/'):
for name in files:
indexlist.append(root + name)
if ".pdf" in name[-5:]:
pdf_filenames.append(name)
for files in indexlist:
if ".pdf" in files[-5:]:
pdf_dir_list.append(files)
dictionary=dict(zip(pdf_filenames, pdf_dir_list)) #maps the pdf names to their directory address
我知道这是一件很简单的事情,我错过了,但无论是爱情还是金钱,我都看不见它是什么。一双新的眼睛会大有帮助!