1.准备资源
Vs2010或者更高版本。本教程使用vs2019
1.1Tesseract源码。
分支切换到3.04 看到vs2010 git地址https://github.com/tesseract-ocr/tesseract下载源码 文件夹并命名vs2019
vs打开 重新生成 编译完后会报错
所以我们要配置编译所需要的环境
Tesseract依赖Leptonica图片编辑库
1.2 需下载Leptonica库打开网页https://github.com/tesseract4java/tesseract-vs2013
打开工程 -设置生成模式DLL_realease的选项-然后重新生成工程
将会在下面目录下生成相关dll
在这里插入图片描述
2.继续配置tessarct
打开resseract工程(上面说的vs-2019)
VS2019 设置显示”高级保存选项“
目录
#设置具体步骤
1、点击“工具”–“自定义”选项
2、点击“命令”标签
3、点击“添加命令”按钮
4、点击“文件”菜单,即可看到刚才添加的“高级保存选项”
#“高级保存选项”的使用
指导很详细,解决了主要问题.
错误 C3861 “pixReadFromMultipageTiff”: 找不到标识符 1040 libtesseract305
错误分析
创世界—使用的Tesseract版本是3.05.01, 产生错误的是3.05.02. 因此, 错误的原因可能是 Tesseract、Leptonica1.71版本不符合.
下载Leptonica源码, 通过 cmake 编译, 没发现什么坑. 然后重新指定包含目录、库目录, 还要更改.lib 文件名, 最后编译通过.
Tesseract版本是3.05.00也产生同样错误.
感觉还是直接用 cmake 编译 Tesseract 更加靠谱. 参见
Tesseract 4.0在VS2015上的编译与运行
温素年
https://www.jianshu.com/p/5e8f258cc172
不爽. cppan 下载很慢. 缺少 package, cmake 出错.