在OCR中,存在着两个预处理难题【1】图像角度预判 【2】图像去除扭曲,去除扭曲主要包含两个方面:透视,畸变
由于paper对这方面的论述几乎找不到,尤其是ICCV,NIP,CVPR、ECCV等鲜有新论文
本文主要记录一下各种传统算法以及深度学习算法在图像扭曲上的尝试,持续更新
1. 传统办法简介
- 传统算法一般基于文本来做dewarping,但是很多时候存在问题:文本行较少,版式(layout)比较复杂。
- 场景一般是:相片,表格文档,以及图表之类,基于问本行的做法就很费劲。
- 因此,现在可以充分利用
表格线
以及文本行
同时来做纠正。 - dewarping 重点是删除
透视变换
,以及纸张页面卷曲失真
来提高OCR的精度 - Document Image Dewarping using Robust Estimation of Curled Text Lines 文章的假设是文本行的行间距是固定的,而且页面不存在深度方向的变换(例如页面存在褶皱),即文档表面是光滑的
Ref:
【1】Document Image Dewarping using Robust Estimation of Curled Text Lines