公众号关注 “GitHubDaily”
设为 “星标”,每天带你逛 GitHub!
大家好,我是小 G。
近几年,各类线上办公软件层出不穷,OCR (Optical Character Recognition,光学字符识别)技术也开始被大部分人所知晓与应用。
此中,OCR 被应用最为广泛的,应该要属将图片、或纸质文件扫描成可编辑的电子版文件了。
之前我曾在网上找过不少工具,但大部分都是要收费的。作为一枚喜欢分享 GitHub 开源项目的博主,还是想尽力给大家找一些免费开源,用户友好度比较好的可替代软件。
上个月曾给大家推荐过百度在 GitHub 上开源的一款 OCR 文字识别工具 Panddle OCR,对于想研究具体技术底层原理的同学,这个项目值得一看。
https://github.com/PaddlePaddle/PaddleOCR
不过,今天我想另外推荐一款,相对比较成熟,也更偏向于小白用户的 OCR 工具:PandaOCR。
相较于其他工具,这个开源项目的功能要显得更为齐全与强大。
除了我们日常使用的图片、截图、剪切识别的功能之外,它还拥有智能翻译、朗读、弹窗预览、公式整合等功能。
界面相对于小白用户来说,也显得更为友好:
而除了集成上述功能之外,API 配置灵活也是其最大亮点之一。
例如,在文字识别一项,Panda OCR 便整合了百度飞桨、腾讯、搜狗、有道、阿里、网易等多个平台的接口。
在公式与表格识别、翻译及朗读引擎等位置,也同样可配置多方平台接口。
公式识别:
在此需要多说一句的是,部分平台的接口可能是收费的,大家可按自身需求来定制方案。
最后,放下该项目的 GitHub 地址,大家感兴趣的可前往查看。工具使用教程,可看作者提供的 wiki:
https://github.com/miaomiaosoft/PandaOCR/