对于自动识别验证码,使用trsseract是个不错的选择,有兴趣的的朋友可以试试。
编译tesseract
官网提供了vs2008的编译说明和工程,但在vs2010下的编译时基本相同的,因此我使用的方法就是把vs2008工程转换为vs2010工程,
同时把编译过程中遇到的问题以及解决方法和大家分享一下,希望对正准备使用trsseract库的朋友有所帮助。下载代码
google code 下载一下源代码,并建立build目录。- tesseract-ocr-3.02.02.tar.gz tesseract源代码
- tesseract-ocr-3.02-vs2008.zip vs2008工程文件
- leptonica-1.68-win32-lib-include-dirs.zip tesseract依赖的leptonica的lib和dll文件
创建tesseract-build文