#导入os 进行文件操作,导入PyPDF2(下面的程序为3.0版本)进行PDF合并操作;
import os
from PyPDF2 import PdfReader, PdfWriter
# 获取文件夹下的所有文件名
folder_path = r'D:\个人\报销\2024-1-10' #文件的路径可以根据自己实际设置
file_names = os.listdir(folder_path) #把目标文件夹下面的所有文件作为一个列表传送给file_names
print(file_names) #显示文件下下的所有文件
# 筛选出包含“发票”的PDF文件
invoice_files = [f for f in file_names if '发票' in f and f.endswith('.pdf')]
print(invoice_files)
# 创建一个新的PDF文件对象,用于存储合并后的内容
merged_pdf = PdfWriter()
# 遍历筛选出的PDF文件,将内容写入新的PDF文件
for invoice_file in invoice_files:
with open(os.path.join(folder_path, invoice_file), 'rb') as f: #打开PDF文件
reader = PdfReader(f) #读取PDF文件
for page_num in range(len(reader.pages)): #把PDF文件的每一页添加到新文件中
merged_pdf.add_page(reader.pages[page_num])
# 保存合并后的PDF文件并输出在当前文件夹下面
with open(r'D:\个人\报销\2024-1-10\out_pdf_file.PDF', 'wb') as f:
merged_pdf.write(f)