python识别pdf中的表格并保存execl

识别pdf中的表格并保存execl
pdf每个页码保存一个Execl Sheet页

		# 识别pdf表格保存到Execl
    def Get_Table_From_PDF(self,filePath,):
        y = 0
        j = 0
        # 定义保存Excel的位置
        self.workbook = xlwt.Workbook()                 #定义workbook
        self.sheet = self.workbook.add_sheet('Sheet')   #添加sheet
        pdf = pdfplumber.open(filePath)
        for page in pdf.pages:
            #根据pdf页码生成对应的Execl sheet页数
            if j<len(pdf.pages):
                 j =j+ 1
                 self.sheet = self.workbook.add_sheet('Sheet'+str(j))   #添加sheet
            # 获取当前页面的全部文本信息,包括表格中的文字
            # print(page.extract_text())                     
            for table in page.extract_tables():
                for row in table:  
                    for j in range(len(row)):
                        self.sheet.write(y, j, row[j])
                    y =y + 1
        pdf.close()
        # 保存Excel表
        self.workbook.save('D:/Python/宜10-8-42井完井卡片.xls')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值