pdfplumber模块初始用

最新推荐文章于 2024-05-06 16:10:44 发布

ama7790

最新推荐文章于 2024-05-06 16:10:44 发布

阅读量2.5k

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/98WDJ/p/11283012.html

版权

import pdfplumber 
import re
def pdf_read():
    pdf=pdfplumber.open('文件路径'")#文件路径,读取文件
    page0=pdf.pages[11] #指定页数
    tables=page0.extract_tables()#获得该页的表格
    texts=page0.extract_text()#获得text文本值

pdfplumber 缺省通过表格线来区分行和列，所以下列情况是无法提取出表格的：
* 你的表格是图片，通过选择可以确定是否图片
* 你的表格不是用线来分隔，或者分隔不全，例如列用线，行没线
这种情况下，你就需要尝试：
page0.extract_tables(table_settings={})

转载于:https://www.cnblogs.com/98WDJ/p/11283012.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ama7790

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pdfplumber模块初始用

import pdfplumber import redef pdf_read(): pdf=pdfplumber.open('文件路径'")#文件路径,读取文件 page0=pdf.pages[11] #指定页数 tables=page0.extract_tables()#获得该页的表格 texts=page0.extract_tex...
复制链接

扫一扫