【python自动化办公（10）】python利用pdfplumber库提取PDF文字以及表格内容（复杂表格字段数据的处理）

lys_828

于 2020-01-29 15:19:54 发布

阅读量7k

点赞数 15

分类专栏： python办公自动化文章标签： python excel 数据分析列表字符串

本文链接：https://blog.csdn.net/lys_828/article/details/104066010

版权

37 篇文章 59 订阅 ¥19.90 ¥99.00

订阅专栏

本文介绍了如何使用pdfplumber库从PDF中提取文字和表格，包括提取多个简单表格、将数据写入Excel、去除空行、处理复杂表格字段，并提供了完整的Python代码示例，涉及字符串处理、列表推导式等技巧。

摘要由CSDN通过智能技术生成

pdfplumber.open(pdf路径)/pdf.pages[页数]/page.extract_text()

import os
os.chdir('D:\\python_major\\auto_office10')
import pdfplumber

with pdfplumber.open("Netease Q2 2019 Earnings Release-Final.pdf") as pdf

了解本专栏

关注

专栏目录