我的回答是基于以下假设。在你的情况下,它们可能都没有。
>您可以在分段区域中设置边界框高度的阈值。然后你应该能够过滤掉其他组件。
>您知道数字的平均笔画宽度。使用此信息可以最大限度地减少数字连接到其他区域的可能性。您可以使用距离变换和形态学操作。
这是我提取数字的过程:
>将Otsu阈值应用于图像
>采取距离变换
>使用笔画宽度(= 8)约束对距离变换图像进行阈值处理
>应用形态学操作断开连接
>过滤边界框高度并猜测数字的位置
stroke-width = 8
stroke-width = 10
编辑
>使用找到的数字轮廓的凸包制备面罩
>使用蒙版将数字区域复制到干净的图像
stroke-width = 8
stroke-width = 10
我的Tesseract知识有点生疏。我记得你可以获得角色的置信度。