关于tesseract字符训练遇到的问题及解决方法

最新推荐文章于 2023-03-15 18:19:26 发布

檀一狼

最新推荐文章于 2023-03-15 18:19:26 发布

阅读量3.5k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26805497/article/details/47209925

版权

在OCR中，对字符训练是必不可少的，但是，在训练过程中，却会遇到各种问题，我是小白鼠，刚刚接触tesseract，我把我在做字符训练过程中遇到的问题简单描述一下与大家分享。如果有什么不妥的地方，还请大家多多指教！

1、我们的运行目录一定要在图片所在的目录下，这也是我们之后存放所生成的文件的目录。在做训练之前，要建立一个文件font_properties ，文件名不能变，只能是font_properties,如果你创建的文件是txt格式，或者是别的格式，创建好之后一定要把后缀去掉，如果不去掉，运行时会提示failed to load font_properties from font_properties或者是位置信息错误或者是内存错误或者是运行时逻辑错误。

2、待识别的图片要严格按照命名规则命名，格式为lang.fontname.exp0.tif图片格式为tif或者tiff都可以，lang是我们自己定义的图片名称，可以用任意词代替，如果没有按照格式命名图片，运行时会提示Cannot open lang.fontname.exp0.tif

3、一些自动生成的文件需要自己手动改前缀名，自动生成的文件都是后缀名，前缀为lang，即是我们自己定义的名称，上下一定要保持一致，否则会显示文件不存在。

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。