Python使用pdfplumber直接提取PDF文本内容

前提:提取文本内容的文件必须是应用服务生成PDF文件,而非扫描的pdf文档,当前pdfplumber的版本为0.5.28

第一步:在服务应用的终端中使用下述命令安装pdfplumber包

poetry add pdfplumber

 在输入了上述命令后,会在终端中弹出下述相关安装信息

PS D:\Code\python\poetry-demo> poetry add pdfplumber
Using version ^0.5.28 for pdfplumber

Updating dependencies
Resolving dependencies...

Writing lock file

Package operations: 7 installs, 0 updates, 0 removals

  • Installing chardet (4.0.0)
  • Installing pycryptodome (3.10.1)
  • Installing sortedcontainers (2.4.0)
  • Installing pdfminer.six (20200517)
  • Installing pillow (8.3.1)
  • Installing wand (0.6.7)
  • Installing pdfplumber (0.5.28)

 同时可以看到在对应服务的site-packages目录下会新增下述几个目录:

pdfminer
pdfminer.six-20200517.dist-info
pdfplumber
pdfplumber-0.5.28.d
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值