tesseract本身代码是由c/c++混编而成的,其中有用的简单的接口函数几乎都是在baseapi.h中。从其处理过程中,不难得出:它还需要有一个image处理的类,及相关的方法;这样子,读取图片后,生成image对象,再获取相关的参数;当然还需要有对image对象的读取,版面分析等接口函数;再次,它还定义了很多自身的数据类型,比如:BITS16、array_record、BLOCK、IMAGE等;而且它具有自学的能力。现在,我们从头有调理地简单讲述一下子:(1)tesseract::TessBaseAPI,基础的接口函数,包含了初始化,简单的处理图片文字信息,版面分析的结果体等。(2)IMAGE,只是一个类,里边封装了相关的图片操作,包括图片的读取,图片参数信息的获取等。(3)其他,包括数据类型声明,相关结构体声明,跨平台处理,命令端参数提取等。
我们在实际中用到的就是前两个里边的东西。
声明:以下函数皆是在tesseract::TessBaseAPI域下
1: SetImage
函数声明:
void tesseract::TessBaseAPI::SetImage
(
const unsigned char *
imagedata,
int
width,
int
height,
int
bytes_per_pixel,
int
bytes_per_line
)
为Tesseract 提供待识别的图片。
2:SetSourceResolution
函数声明:
void tesseract::TessBaseAPI::SetSourceResolution(int ppi)
设置源图像的分辨率(像素每英尺),可以计算最终的字体大小信息。 SetImage之后调用此函数。
3:SetRectangle
函数声明:
void tesseract::TessBaseAPI::SetRectangle
(
int
left,
int
top,
int