本系列简单介绍
Tesseract-OCR 3.x版本如何上手使用,只适用于入门级别。
目录
1.源码获取
2.编译
3.测试
1.源码获取
1.1获取tesseract-ocr源码
在github中可以根据需要选择不同的版本
1.2
因为Tesseract依赖Leptonica库,所以还需要编译Leptonica
2.编译
2.1编译Leptonica
step1
将压缩包解压并移动位置如下图
step2
在vs2008中找到工程并使用vs2010打开工程
step3
编译
分别对Release和Debug进行编译,一次成功。
2.2编译tesseract-ocr
step1
在vs2008文件夹中找到工程
step2
用vs2010转换项目后报错误
错误 1 error C1083: 无法打开包括文件:“allheaders.h”: No such file or directory
这是因为
allheaders.h
在Leptonica中,而两个工程目录没有协调导致。
解决方法:
调整目录如下图
step3
调整目录后重新编译,报错
错误 2 error C2146: 语法错误: 缺少“}”(在标识符“銆”的前面)
这是错误由于文件编码格式引起的。
解决方法:
选择vs2010的菜单“文件 -- 高级保存选项”,在窗口中选择“简体中文(gb2312)-代码页936”,保存后重新编译。
终于成功
3.测试
参考资料: