https://www.bilibili.com/video/BV15E411g7py/?spm_id_from=333.788.videocard.2
https://www.bilibili.com/video/BV15E411g7py/?p=2
检验模块安装是否成功:
windows >> cmd >> python >> import pypdf2
mac >> cmd >> python >> import pdfplumber
模块:
pypdf2(非标准库) https://pythonhosted.org/PyPDF2/ 读取,写入,分割,合并PDF
pdfplumber(非标准库)https://github.com/jsvine/pdfplumber 更好读取pdf内容
可收集信息:
很多PDF合并?
一堆财报中找到关键数据?
批量加密PDF?
某页旋转?
利用pdfplumber提取文字(单页)
import pdfplumber with pdfplumber.open(r"D:\公司or工作邮箱\XXXXXXXX.pdf") as pdf: first_page = pdf.pages[1] print(first_page.extract_text())
利用pdfplumber提取全部()