python读取发票并重命名
本程序主要用于解析发票pdf并将其按照日期–金额–项目名进行重命名
一、主程序
主要界面
1.1 配置环境
本项目主要采用pyCharm进行开发
创建python项目
之所以选择创建新的虚拟环境是为了在后续打包过程中可以直接使用新的虚拟环境下的库目录的库进行打包而不用打包一些额外的库从而减小exe程序大小
新建后会创建上图这样的文件目录, 此时新建一个python文件,命名为pdfApp即可
本项目需要下载pdfplnumber库、pyinstaller库
1.2 pdf读取模板
本项目中使用pdfplumber来读取pdf文件并进行解析,因为PyMuPdf不能读取表格,不能识别到具体的发票项目名称
def process():
root_dir = addressEntry.get()
if not os.path.exists(root_dir):
tk.messagebox.showerror(title='错误',
message='目录不存在,请重新输入', )
return
out_dir = root_dir + "/output"
if not os.path.exists(out_dir):
os.mkdir(out_dir)
count = 0
filename_list = []
for file in os.listdir(root_dir):
if file.endswith(".pdf"):
src = os.path.join(root_dir, file)
with pdfplumber.open(src) as pdf:
# pdf = pdfplumber.open(src) # or fitz.Do