研究了3天验证码破解!
尝试了好多种方法,都以失败告终!
不过最后还是在我不断的努力下!成功完成对验证码图片的数字化读取!
测试了一下,正确率在85%以上,还算不错!
总结一下自己的思路过程!
1.用PHP读取验证码图片上每个像素的色彩值!
2.将验证码边框上的色彩变为白色
3.用循环方法,去除背景上的色彩杂点,将数字部分的颜色改为000000
接着就是对图像的读取了!
(1)分割统计点数法
将图片分割为4个部分,每个部分对应验证码的一个数字
然后根据黑色点数的范围来确定是什么数字
123456789 对应的点数应该有所不同!
结果:失败
原因:因为生成的验证码图片,数字的点数并不是总是固定!色彩的灰度等级影响了数字对应的点数!但是能判断出一个数字!就是1 因为1 的点数最少!
(2)细化分割
在上一种想法的基础上,将每个部分,又划分为4个小部分,通过对比每4个小部分的点数比,来确定是什么数字
结果:失败
原因:生成的验证码图片中的数字,会随机产生一个倾斜角度,所以在划分的4个小区域内,点数比,很难有规律!基本上还是只能确定1,还有7,但是很容易出错,那是相当的不准确啊
(3)发送假的SessionID
抓包发现咧,一个固定的SessionID对应一个固定的验证码,假如我伪造COOKIES中的SessionID的值,是不是就是总是可以使用那个验证码呢?
结果:失败
原因:因为当你使用完了一个验证码后,服务器又会将SessionID与一个新的验证码对应上!即使你还是使用这个 SessionID,但是验证码已经过期了!
(4)积累数据库数据,对比分析法
将验证码图片上的像素如第一种方法那样分为4个部分,不同的是,也不数什么点数了!直接将每个部分的色彩转化为一个长字符串,黑色用0表示,白色用1表示,这样,对于一个图片,可以得到4个色彩字符串,然后将这个数据与对应的验证码上的数字,存入数据库中!
然后就是不断的积累数据库中的色彩字符串!
我积累了1100条数据!
然后需要查询的图片数据,发送给PHP文件,然后在数据库中,查找对比,用PHP中的levenshtein函数比较2个色彩字符串的相似程度!找出与数据库中最相近的一个色彩字符串,这样就可以确定是什么数字了!
当数据库越大,查询速度也就越慢,但是越准确!
结果:当然是成功咯!