How to use tesseract-ocr

使用动态库的调用方式:

1. Download tesseract-3.02.02-win32-lib-include-dirs  和leptonica-1.68-win32-lib-include-dirs from http://code.google.com/p/tesseract-ocr/downloads/list

2. 创建工程named TesseractSample 将tesseract-3.02.02-win32-lib-include-dirs里的include 和lib文件夹拷贝到TesseractSample下,将leptonica-1.68-win32-lib-include-dirs 内lib文件夹内的lept168d.lib 和liblept168d.dll 拷贝到TesseractSample工程lib文件夹下

3. 配置工程

项目->属性->c/c++->附加包含目录:..\include\tesseract

项目->属性->链接器->附加库目录:..\lib

代码:

#include "strngs.h"
#include "baseapi.h"
#pragma  comment(lib,"libtesseract302d.lib")

#include <iostream>
using namespace std;

#define FILEPATH	"F:\\TesseractSample\\Debug\\eng.bmp"
#define DIRPATH	"F:\\TesseractSample\\Debug"
//#define FILEPATH	"newpic.tif"
string UTF8ToGBK(const std::string& strUTF8)
{
	int len = MultiByteToWideChar(CP_UTF8, 0, strUTF8.c_str(), -1, NULL, 0);
	unsigned short * wszGBK = new unsigned short[len + 1];
	memset(wszGBK, 0, len * 2 + 2);
	MultiByteToWideChar(CP_UTF8, 0,LPCSTR(strUTF8.c_str()), -1, LPWSTR(wszGBK), len);

	len = WideCharToMultiByte(CP_ACP, 0,LPCWSTR(wszGBK), -1, NULL, 0, NULL, NULL);
	char *szGBK = new char[len + 1];
	memset(szGBK, 0, len + 1);
	WideCharToMultiByte(CP_ACP,0, LPCWSTR(wszGBK), -1, szGBK, len, NULL, NULL);
	//strUTF8 = szGBK;
	std::string strTemp(szGBK);
	delete[]szGBK;
	delete[]wszGBK;
	return strTemp;
}

int _tmain(int argc, _TCHAR* argv[])
{
	/*string tmp="";
	if(getenv("TESSDATA_PREFIX"))
	{
		tmp = getenv("TESSDATA_PREFIX");
	}*/
	
	tesseract::TessBaseAPI  api;  
	//DIRPATH 是程序的运行目录,如果将这个参数设置成null,那么需要设置环境变量TESSDATA_PREFIX
	api.Init(DIRPATH, "eng", tesseract::OEM_DEFAULT);  //init set lang chinese: chi_sim,English:eng

	STRING text_out;  
	if (!api.ProcessPages(FILEPATH, NULL, 0, &text_out))  
	{  
		return 0;  
	}  	
	cout<<text_out.string()<<endl;
	cout<<UTF8ToGBK(text_out.string()).c_str()<<endl;
	system("pause");
	return 0;
}



 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值