python 读取pdf图片_Python提取PDF第一页为封面图片【批量提取】

最新推荐文章于 2023-01-28 12:32:51 发布

weixin_39914752

最新推荐文章于 2023-01-28 12:32:51 发布

阅读量996

点赞数

文章标签： python 读取pdf图片

本文链接：https://blog.csdn.net/weixin_39914752/article/details/111442856

版权

本文介绍了如何使用Python的PyMuPDF模块从大量PDF文件中批量提取第一页作为封面图片，详细展示了核心代码和操作步骤，并提供了相关说明和资源链接。

摘要由CSDN通过智能技术生成

近期要处理一批PDF文件，大约在20G，具体数量不详，需求是把每个文件的页数和第一页转换成图片，在网上查阅各种类库，最终选择的是PyMuPDF模块。最后核心代码量较少，功能实现效果也比较好。

一、安装扩展类pip install PyMuPDF

二、示例代码# coding:utf-8

import os

import fitz

# 解析

def analysis(file_path, save_path, num):

# 资源列表

file_array = []

if os.path.isdir(file_path):

# 目录循环压入

file_count = get_path_file(file_path)

for v in file_count:

file_array.append(v)

else:

# 单文件，单次调用

file_array.append(file_path)

# 判断为空情况

if not file_array:

print("此目录下无文件")

# 执行解析

file_count_num = len(file_array)

print("程序运行中，共计%s个文件" % file_count_num)

for v in file_array:

# print("文件路径：%s" % v)

# 获取文件名称及类型

file_n

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39914752

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

编辑器背后的故事

y98989的博客

10-16

272

编译器背后的故事一、可执行程序是如何被组装的一个源程序到一个可执行程序的过程：预编译、编译、汇编、链接。二、使用gcc 生成 .a静态库和 .so动态库 1、首先创建hello.h、hello.c、main.c文件，使用vim编辑器将目标代码写入其中 hello.c文件内容： hello.h文件内容： main.c中文件内容： 2、将hello.c文件编译成.o文件（1）使用gcc -c hello.c命令生成hello.o文件（2）使用ls查看生成的文件 ...

Android Makefile分析

11-11

148

随着移动互联网的发展，移动开发也越来越吃香了，目前最火的莫过于android，android是什么就不用说了，android自从开源以来，就受到很多人的追捧。当然，一部人追捧它是因为它是Google开发的。对一个程序员来说，一个系统值不值得追捧得要拿代码来说话。我这里并不打算分析android的代码，而是android的makefile，也许大家已经知道了在android源码里，我们可以看见很...

参与评论您还未登录，请先登录后发表或查看评论

Android Makefile 文件讲解

lin364812726的专栏

10-11

778

Android Makefile 文件讲解分类： android2013-03-01 23:37 726人阅读评论(0) 收藏举报 android编译系统的makefile文件Android.mk写法如下 (1) Android.mk文件首先需要指定LOCAL_PATH变量，用于查找源文件。由于一般情况下 Android.mk和需要编译的源文件在同一目录下

用Python从pdf中抽取一页转为图片作为封面图

qq_43674608的博客

09-17

740

最近工作中，经常遇到处理PDF的问题，今天遇到了如何提取PDF第一页作为封面图的问题。查找资料，终于解决，下面是封装好的函数 def GetImageByPdfFilePage(strpdfpath, strimgpath, istartpage = 1, iendpage = 1): if os.path.exists(strpdfpath) and strimgpath != '': strpng = os.path.dirname(strpdfpath) + '\\pdftem

ORACLE 建库过程总结

weixin_34032621的博客

06-11

1，忘记sys密码打开CMD命令窗口，执行以下操作： 1,SQLPLUS /NOLOG; 2, 3,CONNECT / AS SYSDBA 4, 5,ALTER USER SYS IDENTIFIED BY 新密码 6, 7,ALTER USER SYSTEM IDENTIFIED BY 新密码 8, 第二种方法：重建密码文件需要重建密码文件,具体步骤...

python操作pdf做文档的分割、合并，内容提取

weixin_43604754的博客

06-22

2954

Python 操作 PDF 会用的库：PyPDF2 和 pdfplumber PyPDF2 可以更好的读取、写入、分割、合并PDF文件； pdfplumber 可以更好的读取 PDF 文件中内容和提取 PDF 中的表格。对应的官网分别是： PyPDF2：https://pythonhosted.org/PyPDF2/ pdfplumber：https://github.com/jsvine/pdfplumber 输入如下命令在conda种进行安装： pip install PyPDF2 pip in

基于Python操作PDF文件

weixin_44818540的博客

07-19

631

基于Python对pdf文件进行操作。

Python 操作 PDF

weixin_49433597的博客

06-22

1055

Python批量提取docx格式Word文档中所有批注

Python小屋

03-12

1065

封面图片：《Python程序设计基础与应用》（ISBN：9787111606178），董付国，机械工业出版社图书详情：用书教师可以联系董老师获取教学大纲...

oracle手工建库步骤

07-16

oracle手工建库步骤,文档详细描述了手工建库的步骤.

Android makefile文件详解

ncepu307的专栏

09-12

1730

android 编译系统的 makefile 文件 Android.mk 写法如下 (1) Android.mk 文件首先需要指定 LOCAL_PATH 变量，用于查找源文件。由于一般情况下 Android.mk 和需要编译的源文件在同一目录下，宏函数“ my-dir ”右编译系统提供的，用于返回当前路径。所以定义成如下形式： LOCAL_

使用Oracle建库的一般流程[转]

dampce32的专栏

11-13

180

使用Oracle建库的一般流程原文：http://www.blog.namind.com/using-the-general-process-of-building-a-database-oracle.html 一、背景一般在实现一个软件工程项目时，用户习惯于把数据存储在一个集中的对象中。比如：在SQL Server中，针对一个项目，我们一般创建一个数据库但是在Orac...

oracle建库过程

shao326的专栏

04-27

136

oracle数据库建立步骤 1、建表空间： create tablespace icmp datafile '/u01/oradata/wilson/icmp.dbf' size 300M autoextend on next 100M maxsize 2048M extent management local; 建立临时表空间： create temporary tablespace li...

android makefile jar,Android Makefile 文件讲解

weixin_39588679的博客

05-27

138

android编译系统的makefile文件Android.mk写法以下java(1)Android.mk文件首先须要指定LOCAL_PATH变量，用于查找源文件。因为通常状况下Android.mk和须要编译的源文件在同一目录下，宏函数“my-dir”右编译系统提供的，用于返回当前路径。因此定义成以下形式：LOCAL_PATH:=$(call my-dir)上面的语句的意思是将LOCAL_P...

动态与静态函数库的的使用和区别及优缺点