问题描述:现在手上有很多pdf,但是只需要分别其中的某几页,最后合并成一个新的pdf
def det_PDF():# 先对单个文件进行处理
path = r'XXX.pdf' #需要处理的pdf源文件
path2 = r'WWW.pdf'#新的pdf文件
pdfReader = PdfFileReader(open(path, 'rb'))
pdfFileWriter = PdfFileWriter()
numPages = pdfReader.getNumPages() #获取原pdf 的页数
# print(numPages)
pagelist = (0, numPages-1) # 这里设置删除首尾页
for index in range(0, numPages):
if index not in pagelist:
pageObj = pdfReader.getPage(index)
pdfFileWriter.addPage(pageObj)
pdfFileWriter.write(open(path2, 'wb'))
处理完所有的PDF后进行合并
def meger_PDF():
path = r'D:\pdf/'#保存着处理完的pdf的文件夹
files = os.listdir(path) # 列出目录中的所有文件
merger = PdfFileMerger()
for file in files: # 从所有文件中选出pdf文件合并
if file[-4:] == ".pdf":
merger.append(open(path+file, 'rb'))
with open('D:\newfile.pdf', 'wb') as fout: # 输出文件为newfile.pdf
merger.write(fout)