在tesseract官方文档中,提供了一种直接使用vs编译的方法,不需要安装cppan以及sw
打开这个链接,可以发现目前已经支持最新的tesseract4.1.1了
使用git命令递归下载这个项目
git clone --recursive https://github.com/peirick/Tesseract-OCR_for_Windows.git
下载完成后使用vs打开tesseract.sln
接下来利用vs进行编译,在编译的过程中会出现如下错误:
\tesseract_4.1\src\ccmain\equationdetect.cpp(236): error C3688: 文本后缀“銆”无效;未找到文文本运算符或文本运算符模板“operator “”""銆”
打开出现错误的这个文件:
使用文件-高级保存选项,将文件保存为简体中文(GB2312)-代码页936
然后重新编译,这次就可以全部编译成功,生成了tesseract.exe以及libtesseract.lib