文本图像二值化在OCR和相关领域是个老话题,快速而准确的的二值化方法对这些领域的图像进一步处理尤为重要。对于图像亮度特征的有全局二值化、局部二值化,在图像亮度有明显双峰特征的是可进行全局二值化,金典的算法有OTSU,但是一些低质量文本并无双峰特征,这样对这些文本进行二值化就是一种难题。现阶段也存在许多亮度特征局部二值化算法,比如Niblack、Sauvola、Nick,但是这些算法的确定是二值化效果过于依赖所取得窗口大小换句话说是文本字符大小。当然还有一些迭代法、拉普拉斯能量法、Markov随机场等一些方法。本文是《Robust Document Image Binarization Technique for Degraded Document Images》的阅读笔记,对低质量文本图像二值化的一种解决方法。
step 1:构造局部对比度图像
定义:src为原灰度图像
a:根据下试计算局部对比度图像,Imax为局部最大值,Imin为局部最小值e为正无穷小
b:计算权值a,其中Std为src全局标准差y为预定义参数
c:由上两式构造局部对比度图像
得到的图像有明显的双峰特征。
step 2:文本笔记边缘检测
定义:由step1得到的图像为Cimg
a:对Cimg进行Otsu处理提取笔迹边缘像素
b:对src用Canny进行边缘检测得到Canny edge map图像
c:结合a、b保留两幅图像都有的像素点得到图像Edg
step 3:局部阈值化
a:边缘宽度估计得到局部阈值化窗口大小
b:根据下式对Edg图像阈值化处理
step 4:后期处理