OCR神器,PDF、数学公式都能转

我们平时在阅读论文或者文献的时候,PDF都是主力,然而存储在PDF中的信息很难转换成其他公式,尤其是数学公式,在转换过程中会出现大量的信息丢失。

最近Meta推出了一款OCR神器Nougat,可以很好的解决这个问题,它是基于transformer模型构建而成的,可以轻松的将pdf文档转换成MultiMarkDown,即使是数学公式也不在话下。

仓库地址facebookresearch/nougat: Implementation of Nougat Neural Optical Understanding for Academic Documents (github.com)

我们构建一个python虚拟环境,然后激活该虚拟环境

然后运行 pip install "nougat-ocr[api]"即可。

安装完成后,我们用一个pdf文档来做测试

dfdfe529261dce6bb49e2ad2023ecfa5.png

该pdf文档中包含了很多的数学公式,同时也是图片格式,然后我们运行

nougat nougat path/to/file.pdf ,然后在对应的目录会生成一个文件夹,里面包含了一个MultiMarkDown格式的文件,该文件可以通过VScode插件Mathpix来打开。结果如下:

94178d34b6cfd991173c07a2abe99119.png

对比原pdf文档,基本没有什么错误,而且公式的转换堪称完美。想尝试的小伙伴赶紧来试试吧

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于处理数学公式PDF 文件,你可以使用 Python 中的一些库来实现。以下是几个常用的库和方法: 1. PyPDF2:这个库可以用来读取 PDF 文件内容。你可以使用它来提取文本和公式。但是,需要注意的是,PyPDF2 并不会将公式解析为可编辑的 LaTeX 代码。 ```python import PyPDF2 # 打开 PDF 文件 pdf_file = open('path/to/file.pdf', 'rb') # 创建一个 PDF 阅读对象 pdf_reader = PyPDF2.PdfReader(pdf_file) # 获取指定页面的文本 page_text = pdf_reader.getPage(page_number).extract_text() # 关闭 PDF 文件 pdf_file.close() ``` 2. pdf2image:这个库可以将 PDF 页面换为图像,然后你可以使用 OCR(光学字符识别)技术来提取公式。但是这种方法可能不够准确,因为 OCR 技术对于复杂的数学公式可能无法很好地识别。 ```python from pdf2image import convert_from_path # 将 PDF 页面换为图像 images = convert_from_path('path/to/file.pdf', dpi=300) # 对图像进行 OCR 处理,提取公式 # 这里可以使用其他 OCR 库,比如 pytesseract ``` 3. Mathpix API:Mathpix 提供了一个 API,可以将图像中的数学公式换为 LaTeX 代码。你可以使用 Python 的 requests 库发送请求并接收响应。 ```python import requests # Mathpix API 配置 app_id = 'your_app_id' app_key = 'your_app_key' # 发送图像到 Mathpix API response = requests.post('https://api.mathpix.com/v3/text', data={'src': 'data:image/jpeg;base64,base64_encoded_image'}, headers={'app_id': app_id, 'app_key': app_key}) # 解析响应,获取 LaTeX 代码 latex_code = response.json()['latex'] ``` 这些是处理 PDF 数学公式的几种方法,具体使用哪种方法取决于你的需求和预期结果的准确性要求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值