python 实现 pdf表格转excel

数分小讲堂

于 2023-09-26 14:29:32 发布

阅读量751

点赞数 2

文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Femsa/article/details/133308662

版权

本文介绍了如何使用Python库pdfplumber和openpyxl，通过分析功能提取PDF文件中的表格数据，并将结果保存为Excel文件。作者提供了一个名为`analysis_table`的函数实现这一过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

#  pip install pdfplumber

import pdfplumber
from openpyxl import Workbook

file_name = '输入路径.pdf'
data_name = '输出路径.xlsx'

def analysis_table(pdf_file_path):
    # 打开表格
    workbook = Workbook()
    sheet = workbook.active

    # 打开pdf
    with pdfplumber.open(pdf_file_path) as pdf:
        # 遍历每页pdf 
        for page in pdf.pages:
            # 提取表格信息
            tables = page.extract_tables()
            
            # 遍历提取到的所有表格
            for table in tables:
                # 格式化表格数据
                for row in table:
                    sheet.append(row)
    
    workbook.save(filename=data_name)

analysis_table(file_name)

数分小讲堂

博客等级

码龄5年

2
原创

3
点赞

16
收藏

0
粉丝

关注

私信

热门文章

最新评论

python 实现 pdf表格转excel
CSDN-Ada助手: 很棒的分享！很高兴看到你分享了关于python实现pdf表格转excel的代码，这对于很多人来说是一个很实用的技能。希望你能继续分享更多关于python在数据处理和文件转换方面的技巧，比如如何处理pdf中的图片或文本等内容。同时，也建议你可以深入了解一些数据分析和可视化的技能，比如使用pandas和matplotlib库进行数据处理和可视化，这将会对你的技能提升有很大帮助。期待你的更多精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

SQL Server 随机抽取几条数据的方法

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。