Tesseract-OCR入门使用(2)-VS2010调用API

本系列简单介绍 Tesseract-OCR 3.x版本如何上手使用,只适用于入门级别。

目录
1.DLL的获取
2.环境配置
3.调用API
4.关于API

1.DLL获取
Tesseract-OCR除了提供命令行方式调用(具体看参考《 Tesseract-OCR入门使用(1)-安装包获取和命令行调用 》),还支持API方式的调用。
不过支持API的DLL并未包含在常见的安装包中,需要另行获取。
下载地址:tesseract-3.02.02-win32-lib-include-dirs(网上很多链接都指向Google,但是目前已经不能使用,目前建议直接在CSDN上下载)
PS:在使用后发现缺失 liblept168.dll文件,可以从Tesseract-OCR在VS2010下调用API所需要的dll文件下载

2.环境配置
想要使用API,就需要在工程中引入其DLL,具体需要
step1  将下载的include文件夹和lib文件夹拷贝至相应目录(只要能找到即可)

step2  引用以下.h文件和.lib文件
#include "baseapi.h"
#include "strngs.h"
#pragma comment(lib,"../../../Lib/tesseract_302/lib/libtesseract302.lib")

step3  将识依赖的文件拷贝至运行目录(如Debug,Release等)

3.调用API
本文只设计最基本的调用,因此代码非常简单
tesseract::TessBaseAPI  api;  
	api.Init(NULL, "eng", tesseract::OEM_DEFAULT);  //初始化,设置语言包,中文简体:chi_sim;英文:eng;也可以自己训练语言包
	STRING text_out;  
	if (!api.ProcessPages(chDst, NULL, 0, &text_out))  
	{  
		//return 0;  
		AfxMessageBox(L"api error");
	}  
	delete chDst;
PS:因为本文采用MFC作为测试环境,代码还包含字符类型转换以及一些简单MFC API,但是与Tesseract无关,因此就不做说明。

4.关于API
其实 Tesseract-OCR的API功能还算全面,本文篇幅有限,就不再一一说明,具体可参考API examples
而且从api看来Tesseract-OCR是有规划版面分析的,虽然现在没啥用。

以下是完成后的Tesseract-OCR API调用Demo,是不是比命令行方便很多:)

参考资料
6.《 API examples
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值