pdf 切割与合并

切割

import PyPDF2
#打开一个可读的pdf
pdfReader = PyPDF2.PdfFileReader('GPT-2.pdf')
#获取pdf总页数
pdfnums = pdfReader.numPages#24
# m每个文档分多少页
group_num = 4
# 计算查分份数
split_num = pdfnums // group_num +1

for num in range(1,group_num+1):
    #创建空白的pdf对象
    pdfWriter = PyPDF2.PdfFileWriter()
    with open(f'GPT-2_{str(num)}.pdf','ab+') as newFile:
        #提取指定页面范围
        for pageNum in range(split_num*(num -1), split_num*num if num != group_num else pdfnums):
            #获取每一页的内容
            pageObj = pdfReader.getPage(pageNum)
            #将每一页的内容添加到第一次循环创建的空白文档对象中
            pdfWriter.addPage(pageObj)
        #保存并写入本地文件,并对每个文档命名  
        pdfWriter.write(newFile)

合并


import PyPDF2
 
def PDFmerge(pdfs,output):
    
    #创建一个pdf文件合并对象
    pdfMerger = PyPDF2.PdfFileMerger()
    
    #逐个添加pdf
    for pdf in pdfs:
        with open(pdf,'rb') as f:
            pdfMerger.append(f)
 
    #将内存中合并的pdf文件写入
    with open(output,'wb') as f:
        pdfMerger.write(f)
 

def main():
    #需要合并的pdf名称
    pdfs = ['GPT-2_1.pdf','GPT-2_2.pdf','GPT-2_3.pdf','GPT-2_4.pdf']
    
    #合并完成的pdf名称
    output = 'GPT-2_new.pdf'
 
    #调用PDFmerge函数,进行合并
    PDFmerge(pdfs,output)
    
if __name__ == '__main__':
    main()

在这里插入图片描述
PS: 不知道为啥切完大小很奇怪,不是理想大小 _!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值