1. 当不输入验证码时,会不会作为输入正确处理
2. 验证码内容是否包含在了页面内容或者包含在了http字段中,例如cookie
3.
4. 当验证码只是由有限的几个字符组成,那么可以穷举所有的验证码图片的md5值,然后建立一个验证码图片值和验证码图片md5值的映射,攻击者攻击的时候,会得到验证码图片,然后计算出这个验证码图片的md5值,再从映射表里面找到对应的图片值,用这个值提交表单,绕过验证码,实现攻击
5. 脚本调用Tesseract工具图片识别出验证码,然后提交。但是为了防止图片识别,往往识别码图片会有背景颜色,这个可以通过RMagick module(ruby脚本)的image类的threshhold函数进行图片净化,提高识别率. 识别码的字符形状很可能被扭曲,以防止识别,这个可以通过RMagick module(ruby脚本)的image类的implode来还原字符,便于清晰阅读,具体代码如下:
require 'RMagick'
image = Magick::Image.read("current8.png").first
image = image.implode(IMPLODE)
image = image.threshold(THRESHOLD)
image.write("current8.png")
6. 现在很多验证码图片需要简单的运算,对于这种验证码绕过,建议使用上面第五步的方法处理后读取到验证码图片内容,然后用脚本编写一个解析器即可