python 提取pdf内容

最新推荐文章于 2025-01-08 16:52:15 发布

秋枫96

最新推荐文章于 2025-01-08 16:52:15 发布

阅读量385

点赞数 6

文章标签： python pdf 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58944591/article/details/138890147

版权

pdf截图

把pdf文件截取感兴趣的区域，并保存为.jpg格式图片，上面写上感兴趣的信息，并绘制一些图形，
pil默认的字体不能改变字号，需要下载新字体http://xiazaiziti.com/210356.html
然后在fontPath写入字体的路经即可

import os
import fitz  # PyMuPDF
from PIL import Image,ImageDraw,ImageFont
 
def moveimg(fileDir, tarDir,zoom):
    pathDir = os.listdir(fileDir)  # 获取目录下文件名称
    for file in pathDir:
        name = fileDir + '/' + file
        
        # # 打开PDF文件
        document = fitz.open(name)
        # # 获取特定页面
        page = document[0]
        rect = fitz.Rect(70, 40,570, 650)  # 设置裁剪区域

        pic = page.get_pixmap(matrix=fitz.Matrix(zoom, zoom),clip = rect)
        
        pix_image = Image.frombytes("RGB", [pic.width, pic.height], pic.samples)
        draw

最低0.47元/天解锁文章

博客等级

码龄4年

24
原创

162
点赞

535
收藏

110
粉丝

关注

私信

热门文章

最新评论

香橙派使用摄像头
名字569: 这个香橙派手册里有提这个，好像要关一下某个服务
rk3588使用gstreamer推流
gnbernie: 你好，我目前在RK3588上遇到了用 gst-launch-1.0, pixelformat=NV12，1920x1080@30，卻只能跑到23fps的問題。有幸看到你的內文說"由于yuy2格式只支持640X480分辨率30帧的图像"，請問這是哪來的資料呢?謝謝。
rk3588 ffmpeg使用硬件解码
月夜星河: 实际也没什么卵用，不用加了
香橙派使用摄像头
李浩227: 博主发绿的问题因该是白平衡参数，但是没有看到配置的地方，你有办法吗
rk3588 ffmpeg使用硬件解码
汤姆耶 Tom Yea: 我也是，搞了好几天了，命令行中输入命令都可以找到 libdrm 的，版本号都可以返回，但一编译就报 libdrm not found using pkg-config

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。