python odoo pdf文件位置获取

最新推荐文章于 2023-06-21 11:23:29 发布

信息化未来

最新推荐文章于 2023-06-21 11:23:29 发布

阅读量273

点赞数

分类专栏： 0doo13

本文链接：https://blog.csdn.net/fqfq123456/article/details/115578254

版权

0doo13 专栏收录该内容

170 篇文章 26 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了PyMuPDF库在处理PDF文件中的优势，它提供了访问PDF、XPS等多种格式文件的强大功能，相比PDFminer和PDFplumber更加全面。通过示例展示了如何使用PyMuPDF打开文档。

摘要由CSDN通过智能技术生成

# 我们使用PDFminer、PDFplumberr操作PDF文档中的文本信息有些功能达不到，今天试验了一下PyMuPDF。PyMuPDF可从Python环境中访问MuPDF的许多重要功能，使用起来很方便，并且
# MuPDF可以访问PDF、XPS、OpenXPS、CBZ，FB2和EPUB（如后辍.pdf，.xps，.oxps，.cbz，.fb2.epub）等很多种格式的文件，所以相较于前两个库，PyMuPDF的功能更加强大，值得我们好好研究
参考文档：https://pymupdf.readthedocs.io/en/latest/
# doc = fitz.open(ifile) #打开文档））
# # doc=fitz.Document(ifile) 与上一行语句作用相同

def pdf_text(path):
    doc = fitz.open(path)
    # print(doc)
    lenXREF = doc._getXrefLength()
    req_text = []
    for page in doc:
        blocks = page.getText('dict').get("blocks

了解本专栏