Python提取pdf表格至excel文件

最新推荐文章于 2024-05-24 17:41:56 发布

HarryFooty

最新推荐文章于 2024-05-24 17:41:56 发布

阅读量703

点赞数

分类专栏：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44500833/article/details/118858712

版权

笔记专栏收录该内容

64 篇文章 1 订阅

订阅专栏

功能介绍：

提取pdf文件中的表格数据到excel文件中

视频演示：

Python 将pdf表格转换为excel表格

界面：

在这里插入图片描述

轮子	文件大小
处理pdf文件：pdfplumber 处理excel：openpyxl

核心code：

def extract_table(pdf_file):
    fn = pdf_file[pdf_file.rfind('\\') + 1: -5]
    wb = Workbook()
    wb.remove(wb.worksheets[0])
    with pdfplumber.open(pdf_file) as pdf:
        index = 1
        for page in pdf.pages:
            tables = page.extract_tables()
            for table in tables:
                ws = wb.create_sheet(title=f'Page{index}')
                for row in table:
                    ws.append(row)
                index += 1
    wb.save(f'{fn}.xlsx')

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
Python提取pdf表格至excel文件

功能介绍：提取pdf文件中的表格数据到excel文件中视频演示： Python 将pdf表格转换为excel表格界面：轮子文件大小pdfplumber核心code：def extract_table(pdf_file): fn = pdf_file[pdf_file.rfind('\\') + 1: -5] wb = Wor
复制链接

扫一扫

专栏目录

HarryFooty CSDN认证博客专家 CSDN认证企业博客

码龄6年

66: 原创

7万+: 周排名

182万+: 总排名

9万+: 访问

: 等级

1375: 积分

62: 粉丝

62: 获赞

68: 评论

227: 收藏

私信

关注

热门文章

分类专栏

笔记 64篇
Power Query 2篇

最新评论

Outlook附件自动存储
æäºº: Hello 为什么我的outlook下面没有security
Selenium反反爬-滑块验证
(๑•飞星ω•็ั๑): 是不是最新版没有这个$cdc_asdjflasutopfhvcZLmcfl_ vim和notepad里面搜了没有
Outlook附件自动存储
HarryFooty: 改下vba代码的路径就可以了
Outlook附件自动存储
weixin_46552929: Sub SaveAttachment(ByVal Item As Object, path$, Optional condition$ = "*") Dim olAtt As Attachment Dim i As Integer Set regEx = CreateObject("VBSCRIPT.REGEXP") With regEx .Global = True .Pattern = "[\\:&\/\*\?""\<\>\|]|[^A-Za-z0-9\u4e00-\u9fa5]" If Item.Attachments.Count > 0 Then Pfloder = path '直接将Pfloder设置为所需的路径 For Each att In Item.Attachments If att.FileName Like condition Then att.SaveAsFile Pfloder & "\" & att.FileName '注意这里需要添加转义符"\" End If Next End If End With Set olAtt = Nothing End Sub Sub 保存(Item As Outlook.MailItem) 'Debug.Print "有邮件" 'MsgBox "有邮件" SaveAttachment Item, "C:\Mails\" End Sub 这样就可以了吧
Outlook附件自动存储
weixin_46552929: 根据你的指引我已经成功实现利用规则下载了附件，请问如何将附件不用新建文件夹，只将附件下载到指定文件夹。谢谢

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。