随着互联网时代的兴起,越来越多的人和电脑打交道,办公也会需要处理各种复杂的文件信息。比如说两份或者多分PDF文件内容有关联,如何给它整合成一个文档?那么下面的Python代码你可以看看,学会了能省很多事情。
# pdf_merging.py
from PyPDF2 import PdfFileReader, PdfFileWrite
def merge_pdfs(paths, output):
pdf_writer = PdfFileWriter()
for path in paths:
pdf_reader = PdfFileReader(path)
for page in range(pdf_reader.getNumPages()):
# Add each page to the writer object
pdf_writer.addPage(pdf_reader.getPage(page))
# Write out the merged PDF
with open(output, 'wb') as out:
pdf_writer.write(out)
if __name__ == '__main__':
paths = ['document1.pdf', 'document2.pdf']
merge_pdfs(paths, output='merged.pdf')
要合并的PDF列表时,可以使用merge_pdfs()。需要知道保存结果的位置,因此该函数采用输入路径列表和输出路径。然后循环输入并为每个输入创建PDF阅读器对象。
接下来,将迭代PDF文件中的所有页面,并用于.addPage()将每个页面添加到自身。一旦完成对列表中所有PDF的所有页面的迭代,将在结尾处输出结果。