如何提高OCR准确度(Acc)

原创于 2020-07-31 18:23:59 发布

· 4.5k 阅读

·

0

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文本检测专栏收录该内容

69 篇文章

订阅专栏

说到文字识别--OCR技术，当下已被人们广泛使用, 许多公司通过采用OCR技术，将现有的工作流程和业务流程进行了极大的改进。人们在开源对技术上，不断推陈出新，OCR识别技术准确率也不断提升，在生产力方面取得效果也越来越突出。虽然提高OCR准确度不是一夜之间可以做到的事情，但人们肯定会在适当的时候尝试这样做。

那么如何来微调（finetune）他们的OCR模型呢？嗯，有不同的方法来实现这一目标。我们Infrrd请记住以下提示：

准确度可以在字符（字）级别实现。 ->character level准确度可以在单词(词语)级别获得。 ->word level在字符级别的准确性上，OCR能力判断依据是：它识别正确字符的频率，而不是识别错误字符的频率。类似地，字级准确度意味着OCR识别正确字的频率。Infrrd OCR对于扫描的不同类型的文档具有不同的准确度水平，但我们使其至少达到 >70％的准确度。

为了提高我们的OCR引擎的现有准确性，我们遵循以下步骤：

1.检查源图像质量：

我们的专家确保原始源图像足够可见，以便它们可以获得更好的OCR结果。首先扫描模糊图像是没有意义的。OCR应该能够识别高对比度，字符边界，像素噪声和对齐字符。

2.选择最好的OCR模型：

众所周知，OCR主要负责理解给定图像中的文本，因此有必要选择能够以更好的方式预处理图像的正确图像。我们的软件做得很好。尽管如此，我们仍然不断更新它，以使结果更准确。

3.将图像缩放到合适的大小：

我们尝试将图像缩放到大约300 dpi的标准尺寸。任何低于此尺寸的图像都会产生不清晰的结果，而高于600 dpi的图像会使输出文件变大而质量不高。

4.增强图像对比度：

在OCR中扫描图像之前，对比度和密度是需要考虑的重要因素。我们处理图像以增强这些因素以获得更清晰的输出。

5.消除图像中的噪音：

如果图像中存在背景或前景噪声，我们会将其删除，以便我们获得高质量的数据提取。

6.正确准备和处理文件：

我们确保可以将任何大小的文档加载到扫描仪中。此外，我们的捕获软件减少了文档准备时间，因为它们被送入这些扫描仪。

7.纠正和分析页面布局：

在预处理阶段，重要的是校正页面以使字线是水平的。我们尝试降低页面布局的复杂性，以帮助OCR以更准确的方式识别文本边界。

8.分析角色边缘：

捕获工具和光学字符识别软件必须能够优化字符边缘，以便在提取结果时所需的劳动力最少。

9.使用过滤器，数据库和同义词库：

应特别注意减少错误。这就是为什么我们使用语言过滤器，数据库和同义词库，以便提取的结果有意义，不需要进一步检查。

我们一直在尝试和测试新方法，以便在提取后获得更准确的结果。然而，这不是一夜之间的过程，它需要彻底了解预处理步骤才能获得动力。首先，了解必须扫描的文档的缺陷是非常重要的。只有这样才能采取必要的措施来提高OCR的准确性。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。