java tessbaseapi,Tesseract--主要API功能介绍

最新推荐文章于 2021-03-20 03:09:17 发布

轻萌小说

最新推荐文章于 2021-03-20 03:09:17 发布

阅读量665

点赞数

文章标签： java tessbaseapi

本文详细介绍了Tesseract OCR库中的TessBaseAPI Java接口，包括SetImage、SetSourceResolution、SetRectangle等关键函数，用于图像处理、识别区域设定、阈值处理等。此外，还提及了页面布局分析、识别过程以及获取不同级别的图像组件等功能，适用于文本检测与提取的场景。

摘要由CSDN通过智能技术生成

tesseract本身代码是由c/c++混编而成的，其中有用的简单的接口函数几乎都是在baseapi.h中。从其处理过程中，不难得出：它还需要有一个image处理的类，及相关的方法；这样子，读取图片后，生成image对象，再获取相关的参数；当然还需要有对image对象的读取，版面分析等接口函数；再次，它还定义了很多自身的数据类型，比如：BITS16、array_record、BLOCK、IMAGE等；而且它具有自学的能力。现在，我们从头有调理地简单讲述一下子：(1)tesseract::TessBaseAPI，基础的接口函数，包含了初始化，简单的处理图片文字信息，版面分析的结果体等。(2)IMAGE，只是一个类，里边封装了相关的图片操作，包括图片的读取，图片参数信息的获取等。(3)其他，包括数据类型声明，相关结构体声明，跨平台处理，命令端参数提取等。

我们在实际中用到的就是前两个里边的东西。

声明：以下函数皆是在tesseract::TessBaseAPI域下

1: SetImage

函数声明：

void tesseract::TessBaseAPI::SetImage

(

const unsigned char *

imagedata,

int

width,

int

height,

int

bytes_per_pixel,

int

bytes_per_line

)

为Tesseract 提供待识别的图片。

2：SetSourceResolution

函数声明：

void tesseract::TessBaseAPI::SetSourceResolution(int ppi)

设置源图像的分辨率(像素每英尺)，可以计算最终的字体大小信息。 SetImage之后调用此函数。

3：SetRectangle

函数声明：

void tesseract::TessBaseAPI::SetRectangle

(

int

left,

int

top,

int

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
java tessbaseapi,Tesseract--主要API功能介绍

tesseract本身代码是由c/c++混编而成的，其中有用的简单的接口函数几乎都是在baseapi.h中。从其处理过程中，不难得出：它还需要有一个image处理的类，及相关的方法；这样子，读取图片后，生成image对象，再获取相关的参数；当然还需要有对image对象的读取，版面分析等接口函数；再次，它还定义了很多自身的数据类型，比如：BITS16、array_record、BLOCK、IMAGE...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。