Robust Binarization for Video Text Recognition
作者:Zohra Saidane, Christophe Garcia.
会议:ICDAR2007
对图像进行二值化,以得到所需要的前景目标,是个古老而又重要的课题。但是这么多年来,二值化算法的效果,却往往难如人意。其核心难题,就是阈值实在太难选择了。但是,与传统的全局、局部二值化方法相比,这篇文章把二值化转变成了学习和分类问题(2007年的论文,想法还算比较超前的),根据原图直接生成二值化图像,从而避免了阈值选择这个极其麻烦的问题。与此类似的思想,是google的一篇将目标定位问题转化学习问题的论文(Deep Neural Networks for Object Detection,作者是Christian Szegedy, Alexander Toshev, Dumitru Erhan)。
下面把这篇文章的关键技术点复述如下(很多细节还是理解不透,需要花点时间讨论一下细节才行):
1、该方法是一种基于监督式分类器的图像分割技术。通过对当前像素及周边一定邻域内的像素进行综合分析,来判断当前像素是否应该属于前景像素。使用分类器的好处,