tesseract安装文字识别-基础训练
效果对比
训练前:
这里明显可以看出来真的很烂,识别的什么玩意儿
训练后:
完美的训练。
安装tesseract
macOS下安装:
- 首先安装tesseract,这个应该是基础程序吧
brew install tesseract
2.下载语言(字)库
字库下载,可以顺便把tesseract下载了,后面如果异常可能用到这里的文件。
3.训练工具jTessBoxEditor
下载地址:jTessBoxEditor
训练素材
素材来自其他博客。
识别文字
先来撸一把,看看效果。
tesseract 18295877-d1d7ad6d4394555c.png result -l chi_si