Tesseract-OCR 简单的中文数字混合训练

最新推荐文章于 2024-09-13 22:16:47 发布

「已注销」

最新推荐文章于 2024-09-13 22:16:47 发布

阅读量5.2k

点赞数 1

分类专栏： OCR

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/majiahuiCSDN/article/details/81312026

版权

本文介绍了如何使用Tesseract-OCR 4.0和jTessBoxEditorFX 2.0.1进行中文数字的训练。首先下载所需软件和数据，然后通过创建PNG图片、使用jTessBoxEditorFX合并TIFF、生成并编辑BOX文件，再通过命令行工具进行训练，最后合并生成traineddata文件并测试。

摘要由CSDN通过智能技术生成

提示，我当前Tesseract-OCR 版本是 4.0 ，jTessBoxEditorFX是2.0.1

1.下载Tesseract-OCR 链接

2.下载jTessBoxEditorFX 链接，如果中文一定要选择FX版本（基于Java，需安装JDK）

3.Tesseract-data目录 Github，下载下来将需要的文件放到Tesseract-OCR安装目录下的tessdata目录下

4.将Tesseract-OCR目录配置到环境变量（不添加也行，比较麻烦）

中文训练步骤

1.创建一个png文件（其他格式也行）

2.打开jTessBoxEditorFX，Tools -- Merge TIFF选择文件，注意选择格式，输入文件名 mychi.myfont.exp0.tif，点击确定，图片目录下会出现一个tif格式文件

最低0.47元/天解锁文章

「已注销」

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。