这里的验证码是内容非常简单的,结构非常清晰的
这里的验证码是内容非常简单的,结构非常清晰的
这里的验证码是内容非常简单的,结构非常清晰的
原起
兴之所至
它是这样的
识别之前
识别之后
分析
之所以说简单,我觉得是这样的:
抽了五张验证码扔进ps,50%透明度,长这样:
- 只有数字为内容
- 每张图的数字都在固定位置
- 没有太大的干扰因素
- 数字字体,形态完全一致
为了识别率尽可能高,我就人为的提取了数字模板(ps里手动处理)
分割处理
因为数字都在固定位置,字体也一样,所以,切出来的长度,宽度也一样。
去除杂点
实际上把图片直接拿去识别正确率也很高了 T_T
特定问题特定解决方案,在ps中观察发现灰白点是由Color(204, 204, 204)和Color(153, 153, 153)构成的。
于是遍历将其变白,也是就非白区域就是内容。
在是简单地遍历去掉八个临近的点都为白的点。
前后对比
识别
干净了许多,拿去和数字模板一一对比。
上公式:
取最小的值所对应的数字。
代码
待续 。。。。。。
写的匆忙,算是mark啦