问题
前段时间一直在做一些OCR相关的尝试,在一些场景文字识别或者车牌识别的过程中,往往在定位到文字位置之后由于摄像机位置造成透视变换影响,在图像中看到的文字往往是倾斜的,这对OCR的精度和速度都造成的极大的影响,
相关算法
目前稳定可靠的文字倾斜检测主要有Radon 变换和 Hough 变换两种,不过这两种算法的时间复杂度都在O(n^3)级别。这种方法往往需要大量数值运算,在文字大量出现的图片显得效率低下力不从心。
介绍
前段时间受lsd直线检测算法的启发,发现可以统计各个方向场的角度来寻找图像中纹理最为密集的两个方向。
想法非常简单。这是我算法介绍的PPT。