内容提要:随着近年来信息化技术的不断提高,验证码识别逐渐渗透入了网络的各个领域。本文主要讨论验证码识别的思路和方向,识别系统设置中需要考虑的相关重点。
一·识别系统的设计:
1.图像二值化
图像二值化:图像显示的时候只能看到两种颜色(经常是黑色和白色)
采用阀值判定法。阀值的选择非常重要,如果选择不好,要么保留了很多噪声信息,要么丢失了很多有用信息。
2.图像的腐蚀
腐蚀可以消除小且无意义的噪声。
这个可以根据自身遇到的验证码的进行多次腐蚀。但过度腐蚀将造成有效信息的大量流失——因为腐蚀号码边缘的同时,内部的空洞也在逐渐的扩大。
3.图像膨胀
膨胀操作之后,验证码图像会变大,此时可以根据需要再次执行腐蚀的操作。腐蚀和膨胀是相辅相成的,我们可以根据实际的情况选择两者执行顺序的先后和重复次数,这个一定要灵活变通。
4.图像中的值滤波
中值滤波对验证码的背景孤立噪声的去除具有较好的效果,验证码内部较小的空洞也可以通过滤波实现填充。我们需要根据自身的实际情况进行多次值滤波的操作。
5.图像的分割
图像分割是根据目标与背景的具体位置,对图像中的目标,背景进行标记,定位,然后持续讲识别的目标与背景分离。有效分割是提取和识别的重中之重。
用投影法进行分割:在号码的区域间隔,投影为空白。在读取验证码信息的时候,设置阀值