python分割PDF为左右单页（均匀分割，保存原格式）

Joy_cxz

已于 2025-05-12 15:53:59 修改

阅读量1.2k

点赞数 24

分类专栏：方便使用的小工具文章标签： python pdf 开发语言

于 2024-01-08 15:32:25 首次发布

本文链接：https://blog.csdn.net/cxz_0030115/article/details/135456986

版权

方便使用的小工具专栏收录该内容

6 篇文章

订阅专栏

本文讲述了作者如何通过Python和PyPDF2库解决将A3格式的PDF转换为A4大小，同时保持分辨率的问题，包括如何将PDF均匀分割为左右单页，并提供了一个示例代码来处理多页PDF的拆分过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

写在最前面：用来批量分割PDF文档为左右单页，均匀分割！

真真python都没有的，先看这篇

先看这个【00基础】配置好python环境

折腾了很久

分割合并这个事情困扰了我很久，合并的事情之前有个帖子用合并图片的形式基本算是解决了【python自动水平拼合图像（拼接绘本用）】（当然，这个是通过拼图片来解决的，直接拼合pdf页面的工作等我有需要了再折腾）

分分合合，我发现我不仅需要拼合功能，更需要拆分的功能。

尝试1：Adobe acrobat pdf

我找到了官方的帖子裁剪 PDF 页面
我的版本在编辑pdf里的裁剪页面
在这里插入图片描述
按照官方的说法，只是隐藏不是真的切割，我还不是很会操作这个。（还是想要更傻瓜一点）

WPS

不过网上的帖子表示wps的会员是可以很方便直接切割pdf的，可是我没有T^T。

尝试2：用Adobe Illustrator—可以处理单页

同事跟我介绍了用可以用Adobe Illustrator来做，就是预设好两个画板，再把pdf放进来，另存就行了，会得到pdf左右页面。
在这里插入图片描述
生成了按照画板切割的两个页面，并且在一个PDF中
缺点：我目前只能一页页处理，对于多页pdf不知道怎么批量操作

试试python

诉求

比如老师发了A3的试卷让孩子打印，但是家里打印机只能打印A4，我怎么能不降低分辨率用A4给孩子打印试卷？
比如我有一个对页排的pdf(比如我之前拼完的那样)，但是我现在想要用打印机打成双面的小册子来看，怎么办？？？

小册子：就像是路边发的广告小册子，按照页码排版，中间用订书机钉起来那种。需要左右页单拆并且按照页码规律重新拼打印

要求

直接处理多页的pdf文件，均匀切分为左右。均匀切分
为了不降低文件的分辨率，不转成图片处理，原文件数据可以保留
成果为单页左和单页右，比如原PDF有n页，那生成的文件是2n个单独页面，分别由原页面左侧页面和右侧页面组成
成果要有序号，方便重新组合

没有要求成果直接合成一整个pdf是为了后续灵活处理，毕竟合并pdf文件是小事。

效果

原始pdf（上次用单页图片合成的本子）
在这里插入图片描述
拆分后

补充点

上面用来演示的因为原本就是图片合成的，所以就还是图片。如果源文件是类似于别的格式导出而成的（比如PPT、WORD、EXCEL等），PDF是带有可读内容的，这个代码尽可能保存了原PDF的可读性，不会降低精度。

再补充两句废话：看一下这里先看这个【00基础】配置好python环境

把PyPDF2 包先装一下
黏贴好代码后，修改源文件路径和目标文件夹路径

源代码

没有做成收费收积分的文件分享，是因为我刚开始学python，也在无私的大佬那里获得过很多帮助。我想会来看我文章的应该也是初学者，求个工具方便好用。并且手头也并没有多少可用的积分，还怕自己碰到骗子，下载下来的代码不可用。

# -*- coding: utf-8 -*-
"""
Created on Mon Jan  8 14:28:03 2024
python3 
用于分割PDF，如A3版面pdf分割为A4大小左右单侧页面单独文件
@author: Joy_cxz
csdn:https://blog.csdn.net/cxz_0030115?type=blog
"""
import os
from PyPDF2 import PdfFileReader, PdfFileWriter, PageObject

def split_pdf_page(pdf_reader, page_number, output_folder):
    original_page = pdf_reader.getPage(page_number)
    page_width = float(original_page.mediaBox.getUpperRight_x())
    page_height = float(original_page.mediaBox.getUpperRight_y())
    left_page = PageObject.createBlankPage(width=page_width / 2, height=page_height)
    left_page.mergeScaledTranslatedPage(original_page, 1, 0, 0)
    right_page = PageObject.createBlankPage(width=page_width / 2, height=page_height)
    right_page.mergeScaledTranslatedPage(original_page, 1, -page_width / 2, 0)
    left_page.mediaBox.upperRight = (page_width / 2, page_height)
    right_page.mediaBox.upperRight = (page_width / 2, page_height)
    left_pdf = PdfFileWriter()
    right_pdf = PdfFileWriter()
    left_pdf.addPage(left_page)
    right_pdf.addPage(right_page)
    with open(os.path.join(output_folder, f'page_{page_number}_left.pdf'), 'wb') as left_out:
        left_pdf.write(left_out)        
    with open(os.path.join(output_folder, f'page_{page_number}_right.pdf'), 'wb') as right_out:
        right_pdf.write(right_out)

def split_all_pages_in_pdf(input_pdf_path, output_folder):
    pdf_reader = PdfFileReader(open(input_pdf_path, 'rb'))
    for page_number in range(pdf_reader.numPages):
        split_pdf_page(pdf_reader, page_number, output_folder)

# 指定PDF文件和输出文件夹路径
input_pdf_path = r'C:\Users\Desktop\test\T001.pdf'  # 替换PDF文件路径
output_folder = r'C:\Users\Desktop\test'  # 替换为输出文件夹路径

split_all_pages_in_pdf(input_pdf_path, output_folder)