从截图里面识别数字_手把手教你怎么用macOS 自带的Automator 做自己的OCR公式识别工具...

最新推荐文章于 2024-06-04 10:42:30 发布

weixin_39692253

最新推荐文章于 2024-06-04 10:42:30 发布

阅读量490

点赞数

文章标签：从截图里面识别数字

前言

因为平时会看一些文献，需要摘抄里面的公式做笔记，但是公式又多又长的时候，用手打latex就不是那么香了。而且有时候还会记不住latex语法，这可真是太为难胖虎我了。所以，像手打latex公式这么机械化的事情当然是要交给专门的工具去做啦，自己只用把心思放在学（zou）习（shen）上就好了。

本着折腾不止的精神，索性就自己做一个呗，而且还免费，而且的而且只需要有一些coding基础就可以完成，so easy的好不好。ps：这里使用的是python。pss：即便你是编程小白，我也都把代码贴出来了，基本上可以开盖即用。

【工具功能】：摁下相应的快捷键，截取文档公式，等一会儿会儿，latex公式就在你的剪贴板里了。就问香不香？终于不用手打了。

大致思路

先截屏，截取文献中的公式；
对截图进行OCR识别，得到latex公式，就可以放进自己的markdown文档里面，就大功告成了。
（是不是很简单，全剧终）

其实，要在macOS自带的自动化工具「Automator」里面实现这个「OCR公式识别工具」也是这样的思路，不过得先准备OCR公式识别的API，并写好python脚本。

API准备

1. API准备

这里使用的是mathpix，可以去官网申请API：

Mathpix Snipmathpix.com

每个月有好多次的免费额度，如果是个人使用的话，完全够用，也不用花钱，省下一笔巨款。

2. OCR 公式识别python脚本

按照官方文档调用API，写识别公式的python脚本。

官方文档docs.mathpix.com

当然，你也可以使用我写好的脚本，将你的 app_id 和app_key 填写到对应位置。

#!/usr/bin/env python
import sys
import base64
import requests
import json
import os
from argparse import ArgumentParser, RawDescriptionHelpFormatter
import pyperclip


def sendPic(file_path):

  image_uri = "data:image/jpg;base64," + base64.b64encode(open(file_path, "rb").read()).decode()
  headers = {"app_id": "YourAppId", 
              "app_key": "YourAppKey",
              "Content-type": "application/json"}
  r = requests.post("https://api.mathpix.com/v3/text",
              data=json.dumps({'src': image_uri, "format": ["latex_simplified"]}),
              headers=headers)

  res = json.dumps(json.loads(r.text), indent=4, sort_keys=True)

  return eval(res)["latex_styled"]




if __name__ == "__main__":
  parser = ArgumentParser(description=__doc__, formatter_class=RawDescriptionHelpFormatter)
  parser.add_argument("-i", dest="image", type=str, default=None, help="path to image file. Default None to use clipboard")
  args = parser.parse_args()
  image = args.image

  try:
    res = sendPic(image)
    print(res)
    pyperclip.copy(res)
  except Exception as e:
    pass

用Automator制作workflow