python实际应用1-将多个PDF合并

最新推荐文章于 2024-09-11 09:03:41 发布

风清扬bj

最新推荐文章于 2024-09-11 09:03:41 发布

阅读量868

点赞数 1

分类专栏： Python 综合文章标签： Python

本文链接：https://blog.csdn.net/weixin_44230447/article/details/85231757

版权

这篇博客介绍了如何使用Python将多个PDF文件合并成一个大文件。作者指出，当需要合并PDF时，可以避免使用Adobe的收费版，转而使用Python编写程序实现。文章提到了程序的关键点，包括指定输入和输出目录，以及合并顺序，并建议初学者阅读《编程小白的第一本Python入门书》来学习Python。

摘要由CSDN通过智能技术生成

@2018年12月24日

背景
由于工作性质，经常面对不同的问题，某些场景下SQL+Excel、常用办公软件不能处理，这时到网上找一些案例，自己动手用python处理。后续，借此博客记录比较典型的处理过程。
后续，陆续实际处理的问题，如
1. 合并PDF
2. 拆分PDF
3. 敏感字段MD5脱敏
4. 从非架构化的大文本文件中提取指定条件的记录
需求
工作和生活中有时会遇到将多个pdf文件，合并成一个大文件的情况。例如，扫描时，普通扫描仪或打印机一页生成一个PDF，而一份资料实际多页。Adobe的收费版有合并功能，我们可以自己动手解决。根据网上搜索了几个合并pdf的例子，都是2.X环境下的程序，因此将部分函数替换为3.x环境下。
合并多个PDF的python

'''# -*- coding:utf-8*-'''
import sys
import importlib
importlib.reload(sys)

import os
import os.path
from PyPDF2 import PdfFileReader, PdfFileWriter  
import time
time1=time.time()

# 使用os模块walk函数，搜索出某目录下的全部pdf文件
######################获取同一个文件夹下的所有PDF文件名#######################
def getFileName(filepath):
    file_list = []
    for root,dirs,files in os.walk(filepath):
        for filespath in f