常用破解方法大致有以下几种:
1, 采集,去噪,二值化,滤波,调用Tesseract OCR,识别返回结果;
java 代码工程http://download.csdn.net/detail/ronghua_liu/6319701
2,微软的东西Microsoft Office Document Imaging (MODI)做ocr识别。
c#代码工程http://download.csdn.net/detail/ronghua_liu/6319877
3, Asprise OCR,这个是商业的
4,java ocr,这个没用过。
对于识别验证码的程序来说,最难得部分是验证字符的切割和特征码的建立,而国内很多程序员只做验证码时,总是喜欢在验证码加很多干扰素,干扰线,影响效果不说,还达不到很好的效果;所以,要想使自己验证码难于本识别,只做下面两点就够了
1 :字符粘连,最好所有的字符都有粘连的部分;
2 :不要使用规格字符,验证码的各个部分使用不同比例的缩放或者旋转。
只要做到这两点,或者这两点的变形,识别程序就很难识别。我们看看, yahoo 和 google 的验证码就知道,白字黑底,却很难被识别。
Goole:
yahoo:
碰到这种验证码,估计又够呛了。