首先下载tesseract-3.02的资源包,http://download.csdn.net/download/lishuang1224/10012700里面包含安装的所有资源
一.安装软件和dll
1.下载tesseract-3.02.02.exe,并安装,我的安装路径为D:\Program Files (x86)\Tesseract-OCR
2.将第2个资源文件中的tesseract-3.02.02-win32-lib-include-dirs.zip文件解压,将里面的lib和include文件夹复制到D:\Program Files (x86)\Tesseract-OCR目录下
3.将上面资源中第3个文件夹中的liblept168.dll,liblept168d.dll,libtesseract302d.dll复制到Tesseract-OCR\lib目录下,并替换。
4.将第4个文件夹下的chi_sim.traineddata,复制到D:\Program Files (x86)\Tesseract-OCR\tessdata下。
二.修改环境变量和配置环境
1.在系统PATH变量中增加D:\Program Files (x86)\Tesseract-OCR\lib。
2.配置vs2010的工程属性
在包含目录下新增:D:\Program Files (x86)\Tesseract-OCR\include\tesseract
在库目录下新增: C:\Program Files\Tesseract-OCR\lib
如图:
三.测试
建立vs2010工程:
#include "baseapi.h"
#include "strngs.h"
#include<iostream>
using namespace std;
#pragma comment(lib, "libtesseract302.lib")
int main()
{
const char * image = "2.png";
tesseract::TessBaseAPI api;
api.Init(NULL, "eng", tesseract::OEM_DEFAULT);
api.SetVariable( "tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" );
STRING text_out;
if (!api.ProcessPages(image, NULL, 0, &text_out))
{
return 0;
}
printf(text_out.string());
system("pause");
return 0;
}
程序结果如下:
原图: