excel表格分割线一分为二_PDF转Excel的Python代码

本代码由广州75中麻玉国老师分享在NOI教练群内,自己亲测了一下,感觉蛮好玩,所以特意收藏下来,具体代码如下:

0e776c0184c9f333e91a9763b219fa01.png

import pdfplumber
from openpyxl import Workbook
wb = Workbook() # 创建文件对象
ws = wb.active # 获取第一个sheet
myfile = 'CSPJS入门级-公示.pdf' # 把文件名改成自己的实际文件名即可
path = myfile
pdf = pdfplumber.open(path)print('开始读取数据')print(pdf.pages[0].extract_tables()[0][0])
ws.append(pdf.pages[0].extract_tables()[0][0])for page in pdf.pages: # 获取当前页面的全部文本信息,包括表格中的文字 # print(page.extract_text())for table in page.extract_tables(): # print(table)for row in table:if "序号" not in row: # print(type(row))
rowlist = str(row).replace("[", "",).replace("]", "").replace("'", "").replace("\\n", "").split(",")print(rowlist)
ws.append(rowlist) #print('---------- 分割线 ----------')
pdf.close()# 保存Excel表
wb.save(myfile+'.xlsx')print('\n')print('写入excel成功')

6353433f5b7c80a0f8813b22878bb3b6.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值