今日份Python小应用:PyPDF2,Python合并多份pdf为一份文件

Python合并多份pdf文件为一份

PyPDF2库说明

PyPDF2官方文档
PyPDF2库可以很方便的处理 pdf 文件,提供读,割,合并,文件转换等多种pdf文件操作。

PDF文件合并思路:

  • step1:os.listdir方法(函数)获取指定路径目录下所有pdf文件名称
  • step2:.path.join方法拼接成绝对路径
  • step3:创建PdfFileMerger对象,这是专门用来合并pdf文件的对象
  • step4:append()将所有文件
  • step5:最后,使用write()方法(函数)将所有pdf文件写入到一个文件

PyPDF2库安装

pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple

示例代码

import os
from PyPDF2 import PdfFileMerger

# 定义即将读取的指定PDF文件路径,注意文件的顺序,正斜杠/
target_path = 'C:/Users/zero/JupyterProject/data/tempPDF'

pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf')]
pdf_lst = [os.path.join(target_path, filename) for filename in pdf_lst]

# 合并pdf文件
file_merger = PdfFileMerger()
for pdf in pdf_lst:
    file_merger.append(pdf)     

# 合并pdf文件,并输出到指定路径
file_merger.write("D:/zero/Desktop/OutputMerge.pdf") 
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
以下是Python代码,可用于合并PDF并自动添加书签,书签名称为每个文件文件名: ```python from PyPDF2 import PdfFileReader, PdfFileWriter def merge_pdfs(file_paths, output_path): pdf_writer = PdfFileWriter() bookmark_titles = [] for path in file_paths: pdf_reader = PdfFileReader(path) bookmark_title = path.split("/")[-1] bookmark_titles.append(bookmark_title) for page in range(pdf_reader.getNumPages()): pdf_writer.addPage(pdf_reader.getPage(page)) with open(output_path, "wb") as out: pdf_writer.write(out) add_bookmarks(output_path, bookmark_titles) print("PDFs merged and bookmarks added successfully!") def add_bookmarks(input_path, bookmark_titles): pdf_reader = PdfFileReader(input_path) pdf_writer = PdfFileWriter() for page in range(pdf_reader.getNumPages()): pdf_writer.addPage(pdf_reader.getPage(page)) for title in bookmark_titles: pdf_writer.addBookmark(title, page, parent=None) page += 1 with open(input_path, "wb") as out: pdf_writer.write(out) if __name__ == "__main__": file_paths = ["file1.pdf", "file2.pdf", "file3.pdf"] output_path = "merged_file.pdf" merge_pdfs(file_paths, output_path) ``` 在上面的代码中,`merge_pdfs()`函数接受一个文件路径列表和输出文件的路径。它首先迭代文件路径列表,将每个PDF文件的所有页面添加到一个`pdf_writer`对象中。在此过程中,还会添加一个包含每个文件名的书签标题列表。合并后的PDF文件将写入指定的输出路径。 然后,`add_bookmarks()`函数接受合并后的PDF文件路径和书签标题列表。它首先创建一个新的`pdf_writer`对象,并将所有页面添加到其中。然后,它迭代书签标题列表,并为每个标题添加一个书签。每个书签的页面编号将从0开始,并逐个递增。 最后,在`__main__`代码块中,我们可以指定要合并文件路径列表和输出文件的路径。调用`merge_pdfs()`函数将合并所有PDF文件并添加书签。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北观止

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值