利用pdfplumber处理滴滴电子发票

最新推荐文章于 2025-04-07 13:24:18 发布

Flamsky

最新推荐文章于 2025-04-07 13:24:18 发布

阅读量2.5k

点赞数 1

分类专栏： Python 学习

本文链接：https://blog.csdn.net/Flamsky/article/details/102329544

版权

本文介绍如何使用Python的pdfplumber模块读取并处理滴滴电子发票，通过提取行程信息重命名文件，便于报销管理和检索。通过导入模块，获取报销单列表，读取报销单详细信息，最终实现整齐的文件命名，提升报销效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

利用Python中的pdfplumber模块，读取滴滴打车的行程单信息，对行程单和发票进行重命名。

处理后的文件，非常便于检索、查找、归类和报销填报。

文章目录

每次滴滴打车，回来以后发票处理都挺麻烦。特别是出长差回来，有时候几十张发票，每一张都要与行程单对在一起，打印出来交给财务。

而滴滴的电子发票从邮箱里面下载下来以后，只看文件名是不知道里面的信息的。

比如从邮箱里面下载了一堆这样的文件
文件截图
还好Python有强大的pdf处理工具，简单搜索一下，决定使用pdfplumber这个插件库。

1、导入模块

import pdfplumber
import os
import shutil
# 要用到pdfplumber
# os主要用于获取pdf的文件名
# shutil主要用于copy原pdf文件，到新的文件名

2、获取报销单列表

# 首先获取所有文件名
file_list = os.listdir()
# 建立一个空的“报销单”文件名list
bxd_filename_list = []
# 给出报销单和发票的固定前缀（从邮箱里面下载的样子）
pre_bxd = '滴滴出行行程报销单'
pre_fp = '滴滴电子发票'

# 获得所有的报销单列表
for fname in file_list:
    if '.pdf' in fname and pre_bxd in fname:
        bxd_filename_list.append(fname)