前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
项目背景
- 网上PDF转换工具眼花缭乱,选择困难症,有些甚至还收费;
- 直接以其他格式打开PDF效果一般较差;
- 有些小可爱通过复制粘贴的方式进行操作,浪费了大量的时间。
那么,有没有什么办法可以秒速解决这些问题呢?没错,Python可以。废话不多说,直接上实操。
项目实操
一、PDF转Text
首先,安装一下操作PDF的库pdfplumber。pdfplumber 可以很好的读取 PDF 文件内容和提取 PDF 中的表格,这个库不属于 Python 标准库,需要单独安装。
pip3 install pdfplumber
安装好了之后,咱导入pdfplumber。
import pdfplumber
打开PDF论文,并提取论文第2页面内容。
with pdfplumber.open("兴业B信托项目风险管理研究.pdf") as p:
page = p.pages[2]
textdata = page.extract_text()
打印一