tesseract安装文字识别-基础训练
效果对比
训练前:
这里明显可以看出来真的很烂,识别的什么玩意儿
训练后:

完美的训练。
安装tesseract
macOS下安装:
- 首先安装tesseract,这个应该是基础程序吧
brew install tesseract
2.下载语言(字)库
字库下载,可以顺便把tesseract下载了,后面如果异常可能用到这里的文件。
3.训练工具jTessBoxEditor

下载地址:jTessBoxEditor
训练素材


素材来自其他博客。
识别文字
先来撸一把,看看效果。
tesseract 18295877-d1d7ad6d4394555c.png result -l chi_si

本文介绍了如何在macOS上安装Tesseract并进行基础的文字识别训练。通过下载训练素材,使用jTessBoxEditor进行字符矫正,创建字体文件,最终训练出能有效识别文字的库。在训练过程中,作者遇到并解决了运行脚本找不到命令的问题,通过Docker成功运行命令。
最低0.47元/天 解锁文章
638

被折叠的 条评论
为什么被折叠?



