一、PyPDF2的安装
版本是3.0的才能在python3.0使用,安装的时候注意看一下
Win+R -cmd弹出命令框
输入:
pip install PyPDF2
常用的Pypdf2的命令
常用的Pypdf2的命令
读
pdf_reader = PyPDF2.PdfReader(file)
写
output_pdf = PyPDF2.PdfWriter()
# 将当前页对象添加到PdfFileWriter对象中
pdf_writer.add_page(page)
计算Pdf页数
pdf_reader = PyPDF2.PdfReader(file)
len(pdf_reader.pages)
加密
.encrypt('123456')
解密
if pdfReader.is_encrypted:
pdfReader.decrypt('123456')
文件命名格式1
# 打开一个新的PDF文件,以二进制写入模式
with open(new_file, "wb") as f:
# 将PdfFileWriter对象中的内容写入到新的PDF文件中
pdf_writer.write(f)
文件命名格式2
with open(f'page_{i + 1}.pdf', 'wb') as out_file:
#{i+1}要对应for后面的i
文件名.write(out_file)
二、合并pdf
通过读取文件地址来进行合并和保存。
import PyPDF2 # 引入库
#1.合并Pdf
# 定义pdf路径
# local = "C:\\Users\lenovo\Desktop\八六六" #写成绝对路径方法一:在C:\后面再加一个反斜杠\ #
# 或者是地址前面加r,例为r'C:\Users\Administrator\Desktop\Py\pi_digits.txt'#在这里不适用
# 这两种方法都是为了防止python将一个反斜杠误以为转义标记#
# 先把pdf的地址复制过来看一下:"C:\Users\lenovo\Desktop\八六六\1.pdf"
local ='C://Users/lenovo/Desktop/八六六/'
# 获取所有要合并的PDF文件名
pdf_files = ['1.pdf', '2.pdf', '3.pdf']
# 创建一个新的PDF文件
output_pdf = PyPDF2.PdfWriter()
# 遍历所有PDF文件名
for pdf_file in pdf_files:
# 打开PDF文件
with open(local + pdf_file, 'rb') as file:
# 创建PDF阅读器对象
pdf_reader = PyPDF2.PdfReader(file)
# 遍历PDF中的每一页,并将它们添加到输出PDF文件中
for page_num in range(len(pdf_reader.pages)):
page = pdf_reader.pages[page_num]
output_pdf.add_page(page)
# 将所有合并后的页面保存到输出PDF文件中
with open(local + 'output.pdf', 'wb') as file:
output_pdf.write(file)