用Python显示和处理PDF文件

最新推荐文章于 2024-06-14 14:41:27 发布

DigiHacker

最新推荐文章于 2024-06-14 14:41:27 发布

阅读量1.3k

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/atulxqiang/article/details/106323912

版权

pdf是电子书，文档经常会用的格式，除了下载各种阅读器以外，我们也可以用Python批量处理大量PDF文件。本文用到了pypdf2，pdfminer.six，pdf2image来做常规处理。

pypdf2 获取pdf的基本信息，如作者，书名，页数等


  5 from PyPDF2 import PdfFileReader
  6
  7 def extract_information(pdf_path,filename):
  8     try:
  9         with open(pdf_path, 'rb') as f:
 10             pdf = PdfFileReader(f)
 11             information = pdf.getDocumentInfo()
 12             number_of_pages = pdf.getNumPages()

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

DigiHacker

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
用Python显示和处理PDF文件

pdf是电子书，文档经常会用的格式，除了下载各种阅读器以外，我们也可以用Python批量处理大量PDF文件。本文用到了pypdf2，pdfminer.six，pdf2image来做常规处理。pypdf2 获取pdf的基本信息，如作者，书名，页数等 5 from PyPDF2 import PdfFileReader 6 7 def extract_information(pdf_path,filename): 8 try: 9 with open(pdf_pa
复制链接

扫一扫