Python 操作pdf(pdfplumber读取PDF写入Exce)

最新推荐文章于 2025-04-07 13:24:18 发布

恶霸程序员388

最新推荐文章于 2025-04-07 13:24:18 发布

阅读量2k

点赞数

文章标签： python 开发语言

本文链接：https://blog.csdn.net/weixin_73136678/article/details/128793909

版权

本文介绍了如何使用Python的pdfplumber模块读取PDF文件，并将内容写入Excel。首先讲解了pdfplumber的安装及PDF和Page类的基本属性和方法，然后通过实例展示了读取PDF文本和将其存储到Excel中的具体步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. Python 操作pdf(pdfplumber读取PDF写入Exce)

安装pdfplumber: pip install pdfplumber
复制代码

pdfplumber.PDF类

pdfplumber.PDF类表示单个PDF ,并具有两个主要属性:

属性	说明
pdf.metadata	从PDF的Info中获取元数据键/值对字典。通常包括"CreationDate，“ModDater"，"Producer"等
pdf.pages	返回一个包含pdfplumber. Page实例的列表,每一一个实例代表PDF每一页的信息

pdfplumber.Page类

pdfplumber.Page类常用属性

属性page_ number	说明
.page_ number	顺序页码,从1第一页开始,从第二页开始2 ,依此类推
.width	页面的宽度
.height	页面的高度
.objects/ . chars/ .lines/ .rects/ . curves/ .figures/ . imag