PyPDF2库可有效对pdf进行页面编辑,网上搜到的大多是PyPDF库的使用方法,而两者语法又有较大的区别,相对来说PyPDF2简单易用,这里介绍其基础使用方法,可满足大多数的应用。
PyPDF2最主要的函数是读文件(PdfReader)和写文件(PdfWriter)。读取文件后,可通过pages函数读取文件页数,通过add_page函数把页面加到文件中。此外还有页面旋转(rotate)和本文提取(extract_text)等功能。
以下代码示例
from PyPDF2 import PdfReader, PdfWriter
reader = PdfReader("C:\\Users\\Administrator\\Desktop\\t.pdf") #文件读取
number_of_pages = len(reader.pages) #文件页数
page = reader.pages[0] #第一页提取
page.rotate(90) #PDF页面旋转,顺时针方向
out = PdfWriter() #新建一个可写文件
out.add_page(page) #将读取的第一页添加到out
path_out = "C:\\Users\\Administrator\\Desktop\\test.pdf"
with open(path_out,'wb') as outfile:
out.write(outfile) #文件写入保存