PyPDF2
python对于处理一些日常繁琐事物来说是很便捷的,比如今天我们要说的pdf操作。
需求如题,想从一个pdf文件中截取出指定的页面。我用的工具是py2pdf。
首先,我们需要读取待处理pdf文件。
import PyPDF2 as pdf
inputfile = "/path/to/your/pdf/file"
outputfile = "/path/to/your/new/pdf/file"
reader = pdf.PdfFileReader(inputfile)
pages = [num1, num2, num3, ..., numn]
getpages = list()
for i in pages:
page = reader.getPage(i-1) #page number starts with 0
getpages.append(page)
到此,所需要的页面都已经读取出来并存放在getpages
中。下一步就是将读取出来的页面按顺序写进指定的PDF文件中。
writer = pdf.PdfFileWriter()
for page in getpages:
writer.addPage(page)
with open(outputfile,'a+') as fh:
writer.write(fh)
大功告成!