在爬虫开发时,大家经常会遇到验证码识别,在网站中加入验证码的目的是加强用户安全性和提高反爬虫机制,有效防止对某一特定注册用户用特定程序暴力破解的方式不断地进行登录尝试。在此为大家介绍一下验证码的种类。
【字符验证码】:在图片上随机产生数字、英文字母或汉字,一般有4位或者6位验证码字符。通过添加干扰线、添加噪点以及增加字符的黏连程度和旋转角度来增加机器识别的难度。但这种传统的验证码随着OCR技术的发展,能够轻易地被破解。
【图片验证码】:原理和字符验证码相似,应用了字符验证码的技术,只不过是把随机的字符换成了图片让人识别,例如12306的验证码。同时,一些将广告嵌入到图片上面的验证码,也都归属图片验证码这一类。
【GIF动图验证码】:主流验证码提供的都是静态图片,比较容易被OCR软件识别,有的网站提供GIF动态的验证码图片,使得识别器不容易辨识哪一个图层是真正的验证码图片,在提供清晰图片的同时,可以更有效地防止识别器的识别。据统计,动画GIF验证码防垃圾注入可以达到100%,是一个非常有效的验证码创新模式。同时,GIF动画效果多达百种,也可以增加网站页面的美观效果。
【极验验证码】:是极验验证于2012年推出的新型验证码,基于行为式验证技术,通过拖动滑块完成拼图的形式实现验证,是目前看到的比较有创意的验证码,