最近有不少伙伴在交流群和公众号里面询问公式识别的工具。毫无疑问,目前在公式识别领域遥遥领先于同行的Mathpix是最佳的选择,咱之前在公众号里分别推荐了ta的软件包(科研必备神器推荐之Mathpix公式识别提取)和Mathpix API的matlab版调用方法(公式识别神器Mathpix for matlab 1.0.0版正式发布)。前者若是普通邮箱,每月可以免费使用50次识别,若是教育网邮箱,则每月可以免费使用100次识别;若使用后者API调用方式,则每月可以免费使用1000次免费识别,当然需要有信用卡先注册相应的账号才能使用,过程虽说不复杂,但有的伙伴反馈注册验证过程中往往会出现掉链子的情况。
既然是如此复杂,何必这般操心呢?真正免费的、离线的ta用起来不香吗?其今天即将给伙伴分享的这个公式识别工具其实很久之前就在公众号铁粉专属交流群—科研学术交流群里给他们分享过。不过看大家对公式识别需求这么大,咱就把这个压箱底(当然咱的箱底里可不止这一款)的工具分享出来,当然不排除咱们的关注者中已经有人在使用了这款工具。
今天分享的这款公式识别神器是由大神Lukas-Blecher开发的,采用Python语言编写,在Github中获得2.7K stars和311次forks,从上线至今,平均每月有超过3500次下载,火爆程度杠杠的。
LaTex OCR的识别技术路线如下:
其中最方便的莫过于它添加了GUI界面,可以直接截图识别而无需使用命令行操作。
LaTex-OCR的运行环境要求Python的版本3.7+,并安装相应依赖文件,如PyTorch,详情见setup.py文件中。LaTex-OCR提供三种包:GUI、API和Train,以下是三种包的安装命令:
① pix2tex[gui] (界面版,在CMD中输入latexocr命令直接调出GUI使用),安装命令为:
pip install pix2tex[gui]
② pix2tex[api] (API形式,Streamlit和docker),安装命令为:
pip install -U pix2tex[api]
③ pix2tex[train] (训练模块,支持用户训练自己的公式数据库,增强模型的自我创新能力),安装命令为:
pip install pix2tex[train]
测试效果动画:
以上就是今天分享的全部内容,望伙伴用得愉快,使用中若遇到什么问题,欢迎留言或直接到Latex-OCR项目的issue区搜寻答案或提问。
祝伙伴们生活、工作愉快,有缘再见!!!
参考资料:github.com/lukas-blecher/LaTeX-OCR
如需转载,请在公众号中回复“转载”获取授权,如未经授权擅自搬运抄袭的,本公众号将保留一切追责权利!