使用python读取当前以pdf结尾的文件并保存到excel文件里面
#!pip install PyMuPDF 调用fitz所需要使用的模块
import fitz
import openpyxl
import os
class Electronic:
def __init__(self,pdf_document,workbook,exsave):
self.LIST1 = []
self.LIST2 = []
self.pdf_document = pdf_document
self.workbook = workbook
self.exsave = exsave
self.wb = openpyxl.Workbook()
def invoice(self):
"""
读取数据
"""
doc = fitz.open(pdf_document)
page1 = doc.loadPage(0)
#读取excel里面的文本信息
self.LIST1.append(page1.getText("text"))
#切割回车符
LL = self.LIST1[0].split('\n')
#将读取的数据放入L2列表
self.LIST2.append(LL[75])
self.LIST2.append(LL[76])
self.LIST2.append(LL[77])
self.LIST2.append(LL[70])
#分隔空格后取出数值