前几日在打数学建模比赛,发现有一个需求是把保证书和论文两个PDF文件合并成一个再去提交,但我在网上搜寻了很多的网站和软件,却发现它们大多数都是收费的,以WPS为例,使用合并PDF功能需要开通完整的稻草会员,这对我这样一个穷学生肯定是不能忍的。
当时数模比赛恰好用到了Python处理数据,Python有这么多功能丰富且强大的库,那肯定有可以处理PDF的库了。于是我就开始了在网上的查找之旅,果然不出所料,Python中有一个名为pyPDF2的库,可以对PDF进行处理,这里我们只用到了其中的一部分函数,实现了对PDF的合并。
import os
from PyPDF2 import PdfFileReader, PdfFileWriter
from random import randint
def concat_pdf(read_dirpath):
"""
合并多个PDF文件
@param read_dirpath:要合并的PDF目录
"""
if not os.path.exists('concat_result'):
os.mkdir('concat_result') #创建目录(创建一级目录)
pdf_writer = PdfFileWriter()
# 对文件名进行排序
list_filename = os.listdir(read_dirpath) #返回指定路径下所有文件和文件夹的名字,并存放于一个列表中
print(list_filename)
for filename in list_filename:
filename = read_dirpath+ '/' + filename
pdf_reader = PdfFileReader(filename) # 读取文件并获取文件的页数
pages = pdf_reader.getNumPages()
# 逐页添加
for page in range(pages):
pdf_writer.addPage(pdf_reader.getPage(page))
# 保存合并后的文件
save_path = 'concat_result\concat_result.pdf'
i = 1
while os.path.exists(save_path):
save_path= 'concat_result\concat_result'+str(i)+'.pdf'
i = i + 1
pdf_writer.write(open(save_path,'wb'))
print("文件已成功合并")
concat_pdf('origin_pdf')
考虑到需要用到这个功能的人很多,但并不是所有人的PC上都有Python环境。但我们知道Windows电脑是可以直接运行exe程序的,那可不可以将python程序封装为exe文件呢,答案当然是可以的。
首先我们需要打开命令提示符窗口,输入一下代码,安装pyinstaller
这里由于pip直接下载速度比较慢,所以我使用了清华的镜像
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyinstaller
让后通过cd命令进入python程序所在的文件夹。这里大家记得把cd后面的内容改成自己的文件夹。
C:\Users\R5>cd C:\Users\R5\Desktop\PDF处理
接下来输入
pyinstaller -F -w -i logo.ico concat_pdf.py
其中logo.ico是生成exe文件的logo
这里我使用的是,一张手写的破大防,DDDD
运行之后,exe文件会出现在dist文件夹中,可以改名字。
提取码: 3zm8