OCR文字识别:Tesseract-4.00训练字库
由于tesseract的中文语言包“chi_sim”对中文手写字体或者环境比较复杂的图片,识别正确率不高,因此需要针对特定情况用自己的样本进行训练,提高识别率,通过训练,也可以形成自己的语言库。
步骤:
1、工具准备:
(1)官方文档:https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00
...
转载
2020-01-14 16:53:05 ·
1405 阅读 ·
1 评论