您很可能需要执行以下操作:
>在整个页面上应用Hough Transform算法,这应该会产生一系列页面部分。
>对于您获得的每个部分,请再次应用。如果当前部分产生2个元素,那么你应该处理类似于上面的矩形。
>完成后,您可以使用OCR提取数值。
在这种情况下,我建议你看一看JavaCV(OpenCV Java Wrapper),应该允许你处理Hough变换部分。你会需要一些类似于Tess4j(Tesseract Java Wrapper),它应该允许你提取你之后的数字。
另外,为了减少误报,您可能需要执行以下操作:
>如果您确定某些坐标绝不会包含您之前的数据,请裁剪图像。这应该给你一个更小的图片使用。
>将图像更改为灰度可能是明智的(假设您使用彩色图像)。颜色可能对OCR解析图像的能力产生负面影响。
编辑:根据你的评论,给出这样的:
+------------------------------+
| +---+---+ |
| | | | |
| +---+---+ |
| +---+---+ |
| | | | |
| +---+---+ |
| +---+---+ |
| | | | |
| +---+---+ |
| +---+---+ |
| | | | |
| +---+---