python处理pdf文件的包分析

需要处理pdf文件,因此使用pip search pdf搜索了一下,将相关包的功能做了一下了解。

查看类型的包

包名简述项目地址
tc-pdf查看给定pdf url 的第一页图像https://pypi.org/project/tc-pdf/
   

页面拆分类型的包

包名简述项目地址
pdf-splitterpdf分页https://pypi.org/project/pdf-splitter/
PyPDF2页面处理(合并/分解),基本信息获得https://pypi.org/project/pyPdf/
   

内容处理的包

包名简述项目地址

PDF-Layout-Scanner
pdf解析工具https://pypi.org/project/PDF-Layout-Scanner/
pdfmajorpdf解析工具https://pypi.org/project/pdfmajor/
pdfminerpdf解析工具https://pypi.org/project/pdfminer/
pdfminer.six从pdf中获取信息,主要是文字,也可以用于pdf文档转换为其他文字格式,比如htmlhttps://pypi.org/project/pdfminer.six/
pdfmajorpdf解析工具,是对pdfminer.six的封装https://pypi.org/project/pdfmajor/
yapdfminer对pdfminer的个人延展 
pdfparser pdf parsing toolshttps://pypi.org/project/pdfparser/

其它

包名简述项目地址

pdf-shuffle

A PDF page/image randomizer, or flashcard quiz from a PDF. Or randomize files from a folder.https://pypi.org/project/pdf-shuffle/
PDF-Bookmarka tool for import and export pdf bookmark with the bmk format.https://pypi.org/project/pdf-bookmark/
bericht HTML to PDF streaming 

pdf_hunter

Search for and download PDF file links from a webpage.https://pypi.org/project/pdf-hunter/
   

因为本次主要查找内容处理的包,所以对这部分比较着重,其他的类型会滤掉的 多一些,如果有其它优秀的包,也欢迎留言共享。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值