Python分割PDF页面

1.安装第三方库pdf2

pip install pypdf2 -i https://pypi.tuna.tsinghua.edu.cn/simple

(代码文件、要切割的PDF文件、以及分割的规则文件,三个文件放在同一个目录: XX.py xx.pdf rule.py)

2.代码

from PyPDF2 import PdfReader, PdfWriter
# PDF文件分割
def split_pdf():
    try:
        read_file = input("请输入要拆分的PDF名字(例如test.pdf): ")
        fp_read_file = open(read_file, 'rb')
        pdf_input = PdfReader(fp_read_file)  # 将要分割的PDF内容格式话柄
        page_count = len(pdf_input.pages) # 获取PDF页数
        print("该文件共有{}页".format(page_count))  # 打印页数
        out_detail=input("请输入写有拆分规则的文件名(例如:rule.txt): ")
        with open(out_detail, 'r',True,'utf-8')as fp:
            # print(fp)
            txt = fp.readlines()
            # print(txt)
            for detail in txt:  # 打开分割标准文件
                # print(type(detail))
                pages, write_file = detail.split()  # 空格分组
               #  write_file, write_ext = os.path.splitext(write_file)  # 用于返回文件名和扩展名元组
                pdf_file = f'{write_file}.pdf'
                # liststr=list(map(int, pages.split('-')))
                # print(type(liststr))
                start_page, end_page = list(map(int, pages.split('-')))  # 将字符串数组转换成整形数组
                start_page -= 1
                try:
                    print(f'开始分割{start_page}页-{end_page}页,保存为{pdf_file}......')
                    pdf_output = PdfWriter()  # 实例一个 PDF文件编写器
                    for i in range(start_page, end_page):
                        #pdf_output.add_page(pdf_input.getPage(i))
                        pdf_output.add_page(pdf_input.pages[i])
                    with open(pdf_file, 'wb') as sub_fp:
                        pdf_output.write(sub_fp)
                    print(f'完成分割{start_page}页-{end_page}页,保存为{pdf_file}!')
                except IndexError:
                    print(f'分割页数超过了PDF的页数')
        # fp.close()
    except Exception as e:
        print(e)
    # finally:
    #     fp_read_file.close()
# def main():
#     fire.Fire(split_pdf)
#
# if __name__ == '__main__':
#     main()
if __name__ == '__main__':
    print("******************************说明***************************************")
    print("\t该程序需要两个文件,并添加到该路径下")
    print("\t一个是要拆分的PDF文档,另一个是拆分规则文档(用txt文档写)")
    print("\t拆分规则:页数范围与拆分后文档名,一个文档写一行。例如:")
    print("\t\t\t\t\t1-40 one\n\t\t\t\t\t41-85 two\n\t\t\t\t\t86-125 three")
    print("************************************************************************")
    split_pdf()

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
可以使用 PyPDF2 库来实现 PDF分割和合并。 首先需要安装 PyPDF2,可以使用以下命令进行安装: ``` pip install PyPDF2 ``` 接下来就可以开始实现分割和合并功能了。 ## PDF 分割 PDF 分割可以将一个 PDF 文件拆分成多个单独的文件,可以按照页面数或者指定的页面进行拆分。 以下是一个简单的分割示例,将一个 PDF 文件按照每两页分割成一个文件: ```python import os from PyPDF2 import PdfFileReader, PdfFileWriter def split_pdf(input_path): with open(input_path, 'rb') as input_pdf: input_pdf_reader = PdfFileReader(input_pdf) output_pdf_writer = PdfFileWriter() for i in range(input_pdf_reader.getNumPages()): if i % 2 == 0: output_pdf_writer.addPage(input_pdf_reader.getPage(i)) with open(f'{os.path.splitext(input_path)[0]}_{i//2}.pdf', 'wb') as output_pdf: output_pdf_writer.write(output_pdf) output_pdf_writer = PdfFileWriter() else: output_pdf_writer.addPage(input_pdf_reader.getPage(i)) if input_pdf_reader.getNumPages() % 2 != 0: with open(f'{os.path.splitext(input_path)[0]}_{input_pdf_reader.getNumPages()//2}.pdf', 'wb') as output_pdf: output_pdf_writer.write(output_pdf) ``` 以上代码将每两页作为一组,将其拆分成多个文件。拆分后的文件名为原文件名加上下划线和组数,例如 `input_0.pdf`、`input_1.pdf` 等。 ## PDF 合并 PDF 合并可以将多个 PDF 文件合并成一个文件。 以下是一个简单的合并示例,将多个 PDF 文件合并成一个文件: ```python from PyPDF2 import PdfFileMerger def merge_pdf(input_paths, output_path): pdf_merger = PdfFileMerger() for input_path in input_paths: with open(input_path, 'rb') as input_pdf: pdf_merger.append(input_pdf) with open(output_path, 'wb') as output_pdf: pdf_merger.write(output_pdf) ``` 以上代码将所有输入的 PDF 文件按照顺序合并成一个文件,并保存到指定的输出文件中。 以上就是使用 PyPDF2 实现 PDF 分割和合并的简单示例。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值