《我的眼睛–图灵识别》第十三章:研究:识别分析论
1、扭曲变形
扭曲变形(Twisted)在这里是指,图像上的字符每行像素数据被经过左右的移位产生扭曲的效果,已经不能对其进行正常的字符切割,需要通过图像扭正处理。
扭曲变形
在分析它的有效识别特征过程中,发现这个验证图形码是固定扭曲路线的方式,所以只要按照它的固定扭曲路线进行纠正即可。
扭曲路线纠正
当图像被扭正之后再继续分析,还会发现它的字间距是固定的,只是存在奇偶数位置上的字符出现固定的上下错位摆放,但对识别是没有任何影响的,也不需要进行水平位置的对齐处理。
间距固定
接下来进行二值化处理。只要根据颜色RGB分量值的平均值判断(阈值判断:大于等于200时为黑色,否则为白色),就能很容易得到与背景区分的二值化字符图像。(详情查阅:07预处理:图像滤镜->彩色图像滤镜->二值化)
二值化图像
得到起点位置坐标、数字宽高、字间距和文字数量之后,使用“切割_固定位置()”函数的切割方法进行切割,最终得到独立的字符图像数据。(详情查阅:08训练:图像字符切割->固定位置)
字符图像数据