PyMuPDF 读取pdf时显示 AttributeError: ‘Page‘ object has no attribute ‘getText‘ 解决方案

最新推荐文章于 2024-05-14 14:33:12 发布

Evalikepython

最新推荐文章于 2024-05-14 14:33:12 发布

阅读量6.3k

点赞数 12

分类专栏：错误解决文章标签： python

本文链接：https://blog.csdn.net/qq_42495314/article/details/125531386

版权

6 篇文章 0 订阅

订阅专栏

先上出错代码

import fitz
from tqdm import tqdm #一个遍历的读条包 可以无视

doc = fitz.open(input_path)
content =''
for page in tqdm(doc):
    content += page.getText('html')

这问题很简单因为新款的PyMuPDF包里 getText方法更名为了 get_text 望周知！！！

所以代码更改为

import fitz
from tqdm import tqdm #一个遍历的读条包 可以无视

doc = fitz.open(input_path)
content =''
for page in tqdm(doc):
    content += page.get_text('html')

之后就运行正常了！

致敬我用于搜索的一个半小时！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注