验证码破解方法整理

最新推荐文章于 2024-09-27 20:24:28 发布

weixin_34290352

最新推荐文章于 2024-09-27 20:24:28 发布

阅读量231

点赞数

原文链接：https://my.oschina.net/u/856051/blog/164176

版权

2019独角兽企业重金招聘Python工程师标准>>>

常用破解方法大致有以下几种:

1, 采集，去噪，二值化，滤波，调用Tesseract OCR，识别返回结果;

java 代码工程http://download.csdn.net/detail/ronghua_liu/6319701

2,微软的东西Microsoft Office Document Imaging (MODI)做ocr识别。

c#代码工程http://download.csdn.net/detail/ronghua_liu/6319877

3， Asprise OCR,这个是商业的

4，java ocr，这个没用过。

对于识别验证码的程序来说，最难得部分是验证字符的切割和特征码的建立，而国内很多程序员只做验证码时，总是喜欢在验证码加很多干扰素，干扰线，影响效果不说，还达不到很好的效果；所以，要想使自己验证码难于本识别，只做下面两点就够了
1 ：字符粘连，最好所有的字符都有粘连的部分；
2 ：不要使用规格字符，验证码的各个部分使用不同比例的缩放或者旋转。
只要做到这两点，或者这两点的变形，识别程序就很难识别。我们看看， yahoo 和 google 的验证码就知道，白字黑底，却很难被识别。