mathpix这个软件作为公式识别工具一直很火。不过网上现在对于其API的使用教程,有些已经过时,使用的是很久以前的接口了。
笔者在阅读了官方的API说明之后,就“印刷体”的API进行了python代码实现(还有一个是“手写体”,原理一致,不过并不常用)
导包:
#!/usr/bin/env python
import sys
import base64
import requests
import json
import os
import time
import re
主题部分:
start = time.time()
picture_path = "pdf_picture/" #想要转化的图片文件夹的路径
list_img_test = os.listdir(picture_path)
list_img_test.sort(key=lambda x : float(re.findall(r"\d+\.?\d*",x)