首先下载tesseract-ocr-setup-3.02.02所需要的文件http://download.csdn.net/download/lishuang1224/10012700
一.安装软件和dll
1.安装tesseract-ocr-setup-3.02.02.exe ,我的安装路径为D:\Program Files (x86)\Tesseract-OCR。
2.解压tesseract-3.02.02-win32-lib-include-dirs.zip文件,将里面的lib和include文件夹复制到D:\Program Files (x86)\Tesseract-OCR目录下
3.将资源文件中的liblept168.dll,liblept168d.dll,libtesseract302d.dll复制到D:\Program Files (x86)\Tesseract-OCR\lib目录下。
4.将chi_sim.traineddata复制到D:\Program Files (x86)\Tesseract-OCR\tessdata。
二. 修改环境变量和配置环境
1.将系统PATH变量增加D:\Program Files (x86)\Tesseract-OCR\lib。
2.在vs2010工程配置属性下,在包含目录下增加D:\Program Files (x86)\Tesseract-OCR\include\tesseract,在库目录下增加D:\Program Files (x86)\Tesseract-OCR\lib
如下图:
三.测试
建立vs2010工程:
#include "baseapi.h"
#include "strngs.h"
#include<iostream>
using namespace std;
#pragma comment(lib, "libtesseract302.lib")
int main()
{
const char * image = "1.png";
tesseract::TessBaseAPI api;
api.Init(NULL, "eng", tesseract::OEM_DEFAULT);
api.SetVariable( "tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" );
STRING text_out;
if (!api.ProcessPages(image, NULL, 0, &text_out))
{
return 0;
}
printf(text_out.string());
system("pause");
return 0;
}
测试结果:
原图: