很久以前试了下 Tesseract3.x,识别中文的话那效果惨不忍睹,辣眼睛,直接放弃。
最近听说Tesseract4.x之后加入了机器学习,神经网络学,识别率及运行效率较之前的3.x版本有质的提高,而且可以直接识别一般的验证码。想想就很激动,于是开启了Tesseract4学习之旅。
万万没想到,Tesseract4.0编译过程很曲折,踩了很多坑。过程中参考了以下两篇博客:
https://blog.csdn.net/naidoudou/article/details/70225849
http://www.cnblogs.com/hupeng1234/p/8545371.html
现记录下过程,如下:
整个环境为:Tesseract-master4.0 + VS2015 + Win10, 最后编译的是x86的
*********************************************************************************************************************
第一步:工具、源码准备
1.cppan下载,链接为https://cppan.org/client/
编译过程中相应的支持库是由cppan下载的,我们需要下载cppan并设置其环境变量