jTessBoxEditor说明

最新推荐文章于 2024-01-23 20:47:56 发布

张欣-男

最新推荐文章于 2024-01-23 20:47:56 发布

阅读量3.3k

点赞数 1

分类专栏： OCR 文章标签： tesseract ocr

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sdlypyzq/article/details/78583133

版权

OCR 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

tesseract是开源OCR中开发时间最长、使用最多的ocr，就不多说了。

jTessBoxEditor is a box editor and trainer for Tesseract OCR, providing editing of box data of both Tesseract 2.0x and 3.0x formats and full automation of Tesseract training. It can read images of common image formats, including multi-page TIFF. The program requires Java Runtime Environment 7 or later.

注意：

一张图片对应一个box文件，只有后缀不同，box文件后缀是.box。例如1.jpg对应的box文件是1.box。
box文件里第一行代码一个box的标注，一行有6列，最后一列暂不需要关心。第一列是框内的字符内容或者类别，中间四列分别是box的坐标，分别是x1,y1,x2,y2，但是y1和y2 是以左下顶点为原点计算的。所以如果按照我们正常使用左上顶点作为原点的话，h作为图像的高，y1’和y2’代表左上顶点为原点看的话，y1’ = h - y2, y2’ = h - y1。
打开jtessboxeditor程序看到的是x1,y1,w,h ，是以正常习惯换算得到的。
举例：
这里写图片描述

比如“后”在上图中显示的是10，322，22，22，jtessboxeditor上显示的是按正常习惯（即图像左上顶点为原点（0，0））展示的。

box文件第一行是 “后 10 91 32 113 0”，即x1=10, y1=91, x2=32, y2 = 113

图像的高度是435，所以y1’ = h - y2 = 435 - 113 = 322, y2’ = h - y1 = 435 - 91 = 344

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
jTessBoxEditor说明

tesseract是开源OCR中开发时间最长、使用最多的ocr，就不多说了。 jTessBoxEditor is a box editor and trainer for Tesseract OCR, providing editing of box data of both Tesseract 2.0x and 3.0x formats and full automation of Tesse
复制链接

扫一扫

专栏目录

张欣-男 CSDN认证博客专家 CSDN认证企业博客

码龄15年

257: 原创

3万+: 周排名

4454: 总排名

59万+: 访问

: 等级

6795: 积分

168: 粉丝

167: 获赞

149: 评论

453: 收藏

私信

关注

热门文章

分类专栏

最新评论

ch01_时间序列分析简介
2301_77528658: 按时间顺序排列的这一组随机变量是相互关联的吗？是同一事件下的随机变量，是同一个意义的随机变量吗？
caffe安装问题25_protobuf requires c++11
张欣-男: 都什么年头了，还用caffe。这里提示C++版本最低是11，你编译时设置下试试。
caffe安装问题25_protobuf requires c++11
跨不过: 报错信息：加了还是不管用 D:/software/anaconda/Library/include\google/protobuf/stubs/port.h(123): fatal error C1189: #error : "Protobuf requires at least C++11." [C:\asd\caffe-windows\scripts\build\src\caffe\caffe.vcxproj] CMake Error at cuda_compile_1_generated_absval_layer.cu.obj.Release.cmake:220 (message): Error generating
《深度学习入门：基于Python的理论与实现》源代码
2301_79622067: 找半天了终于找到了
Spyder使用conda的虚拟环境
气势不能倒: 本身anaconda不就带有spider吗？为什么还要下载

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

张欣-男 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。