python读取pdf文件 pdfplumber_Python pdfprumber用于PDF表提取,pythonpdfplumber,表格

import pdfplumber

import pandas as pd

import xlwt

def toEcel():

workbook = xlwt.Workbook() # 定义workbook

sheet = workbook.add_sheet('Sheet1') # 添加sheet

i = 0 # Excel起始位置

path = 'D:\\GKProject\\2020年全国各省选考要求\\上海.pdf'

pdf = pdfplumber.open(path)

print('\n')

print('开始读取数据')

print('\n')

for page in pdf.pages[0:3]:

# 获取当前页面的全部文本信息,包括表格中的文字

# print(page.extract_text())

for table in page.extract_tables():

# print(table)

for row in table:

print(row)

for j in range(len(row)):

sheet.write(i, j, row[j])

i += 1

print('---------- 分割线 ----------')

pdf.close()

# 保存Excel表

workbook.save('上海out.xls')

print('\n')

print('写入excel成功')

print('保存位置:')

print('保存路径/文件名.xls')

print('\n')

input('PDF取读完毕,按任意键退出')

if __name__ == '__main__':

print("开始")

toEcel()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值