项目背景:针对互联网站上需要填写验证码的应用,当时的验证码图像背景干扰不是很明显,识别类型保存数字识别,数学运算
例图:
具体实施方案:
1.、图像二值化,针对图像特点,选择的是OSTU的二值化方法;
2、去除干扰连通区域,主要基于区域的宽、高尺寸特征以及面积大小特征,去除典型非数字区域;
3、字符分割,基于垂直投影法;
4、数字识别,基于模板匹配算法,因为数字较为清晰且只有10类,模板匹配效果较好;
测试结果:99%以上
呵呵,很简单吧,主要是背景较简单,这之后搞过更复杂背景的验证码,以上方法就不可以了,新的方法是基于shape context 算法,
该算法较为不错,对于变形、强干扰数字,均可取得不错的效果,不过算法很复杂,不过最新的opencv,里面包含了该算法,呵呵,在此感叹opencv逆天啊,
之前我研究该算法的论文和源码,花了不少时间。