tesseract SVN:http://tesseract-ocr.googlecode.com/svn/trunk
下载好tesseract 后,找到vs2008目录,编译,发现 allheader.h 这个文件没有,
这是因为tesseract依赖leptonica
所以到http://www.leptonica.com/下载leptonica库就可以了
leptonica-1.68-win32-lib-include-dirs.zip //头文件和lib
然后就把leptonica的include和lib放到tesseract工程指定的目录就OK了,或者直接放在VS2008的VC包含目录和库目录里
这样就OK了
在vs2008\DLL_Debug验证是否可以识别图片里的数字,对于特定语言/字符集,需要在vs2008\DLL_Debug\tessdata有对应的数据,这个数据可以通过训练产生,tesseract也提供了觉大部分的语言支持。
测试命令:D:\tesseract-ocr\vs2008\DLL_Debug>tesseract-dlld.exe images/orderno.tif resultFile
Tesseract Open Source OCR Engine v3.02 with Leptonica
打开resultFile文件,这里面保存了识别的结果