python实际应用1-将多个PDF合并

这篇博客介绍了如何使用Python将多个PDF文件合并成一个大文件。作者指出,当需要合并PDF时,可以避免使用Adobe的收费版,转而使用Python编写程序实现。文章提到了程序的关键点,包括指定输入和输出目录,以及合并顺序,并建议初学者阅读《编程小白的第一本Python入门书》来学习Python。
摘要由CSDN通过智能技术生成

@2018年12月24日

  • 背景
    由于工作性质,经常面对不同的问题,某些场景下SQL+Excel、常用办公软件不能处理,这时到网上找一些案例,自己动手用python处理。后续,借此博客记录比较典型的处理过程。
    后续,陆续实际处理的问题,如
    1. 合并PDF
    2. 拆分PDF
    3. 敏感字段MD5脱敏
    4. 从非架构化的大文本文件中提取指定条件的记录

  • 需求
    工作和生活中有时会遇到将多个pdf文件,合并成一个大文件的情况。例如,扫描时,普通扫描仪或打印机一页生成一个PDF,而一份资料实际多页。Adobe的收费版有合并功能,我们可以自己动手解决。根据网上搜索了几个合并pdf的例子,都是2.X环境下的程序,因此将部分函数替换为3.x环境下。

  • 合并多个PDF的python

'''# -*- coding:utf-8*-'''
import sys
import importlib
importlib.reload(sys)

import os
import os.path
from PyPDF2 import PdfFileReader, PdfFileWriter  
import time
time1=time.time()

# 使用os模块walk函数,搜索出某目录下的全部pdf文件
######################获取同一个文件夹下的所有PDF文件名#######################
def getFileName(filepath):
    file_list = []
    for root,dirs,files in os.walk(filepath):
        for filespath in f
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值