本文来源公众号“OpenCV与AI深度学习”,仅用于学术分享,侵权删,干货满满。
原文链接:高效开源的OCR工具:Surya-OCR介绍与使用
1 背景
在众多企业应用中,光学字符识别 (OCR) 是一项基础技术。在本文中,我们将深入探讨 Surya-OCR,这是最近引起广泛关注的解决方案。文本检测和提取在各种企业用例中至关重要。例如:
- 在制造业中,从文档中提取发票详细信息至关重要。
- 保险行业采用 OCR 技术来自动化索赔的数字化,而医疗保健应用程序则利用 OCR 从临床记录中提取药物信息。
2 Surya-OCR
Surya 是一个文档 OCR 工具包,它具有以下功能:
- 支持 90 多种语言的 OCR,其基准测试优于云服务
- 任何语言的行级文本检测
- 布局分析(表格、图像、标题等检测)
- 读取顺序检测
它适用于一系列文档(有关更多详细信息,请参阅用法和基准)。
g