图像验证码的识别很类似OCR,不过验证码的功能就是防止机器人暴力破解,因此相比于OCR,图片上的干扰因素要多的多。因此如果直接读取图片的特征值进行训练,这样正确率会非常低。
常见的验证码干扰有很多种
1. 首先是噪点,就是验证码图片种有很多鼓励的点,有些噪点的颜色各异,比如下面这张:
2. 其次是字符的倾斜,验证码会有不同程度的旋转、扭曲,使得在识别的时候不易破解。
图像验证码的识别很类似OCR,不过验证码的功能就是防止机器人暴力破解,因此相比于OCR,图片上的干扰因素要多的多。因此如果直接读取图片的特征值进行训练,这样正确率会非常低。
常见的验证码干扰有很多种
1. 首先是噪点,就是验证码图片种有很多鼓励的点,有些噪点的颜色各异,比如下面这张:
2. 其次是字符的倾斜,验证码会有不同程度的旋转、扭曲,使得在识别的时候不易破解。