超强pdf操作功能包pymupdf

最新推荐文章于 2024-08-13 11:07:24 发布

西风西风西风

最新推荐文章于 2024-08-13 11:07:24 发布

阅读量9.3k

点赞数

分类专栏： python 文章标签： pymupdf 原文拷贝

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/democrat800/article/details/79241438

版权

本文介绍了如何使用pymupdf库从PDF中搜索关键词并精确拷贝包含图文的区域。通过page.searchFor()找到内容位置，计算拷贝区域，然后在新文档中使用showPDFpage()方法实现内容复制。大牛的操作方法体现了专业精神。

摘要由CSDN通过智能技术生成

这是一篇pymupdf实例，操作方法是pymupdf的作者jorj.x.mckie 提供的。

实例是这样的：别跟我说乱码问题，如果有是自己程序有问题，给我留言我给你回复：democrat800@qq.com

比如我要把pdf中某些区域原样（有各种图文）拷贝。

First you can use for keywords on a page via page.searchFor(“text”, …). This will give you a list of rectangles where the text can be found. Using this for several different keywords allows you to calculate a rectangle “rect” that you want to be displayed in a new document page.

首先找到关键词，定位需要拷贝的内容：也就是rect的定点参数，左上角，和右下角。

然后用sho

最低0.47元/天解锁文章

西风西风西风

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

西风西风西风 CSDN认证博客专家 CSDN认证企业博客

码龄16年

3: 原创

65万+: 周排名

48万+: 总排名

1万+: 访问

: 等级

183: 积分

1: 粉丝

1: 获赞

4: 评论

10: 收藏

私信

关注

热门文章

分类专栏

python 3篇
pdf 1篇
pymupdf 1篇

最新评论

PyMuPDF DLL问题和乱码问题
Asa.zhu: 调用windows的字体太大了
PyMuPDF DLL问题和乱码问题
学编程的菜鸟: 您好，我想做个给pdf文件添加文字的小工具，但是遇到了插入中文乱码的问题，搜索到您的帖子，想请教如何修改字符库才能解决这个问题呢，非常感谢
超强pdf操作功能包pymupdf
西风西风西风回复 ibetsun: 上github，内存爆满是有解决方案的。我现在记不起来怎么处理了。
超强pdf操作功能包pymupdf
ibetsun: 我用pymupdf将pdf文件页面转成png图片，由于文件多，运行一段时间后，内存爆满，不知道是啥原因。楼主有没有遇到过。

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。