基于Tesseract-OCR4.0及VS2015的多字库扫描图像文字识别
(1)问题描述最近项目中遇到一个问题,扫描印刷体文字识别,其中需要识别的文字包括中文、拉丁文、英文。本来以为很轻松的利用开源库OCR就可以解决,结果使用Tesseract-OCR4.0同时导入多个字库进行识别,识别精度却惨不忍睹。找来Tesseract帮助文档关于初始化语言包的函数Init()的说明,其中有这样一段话:“The number of loaded languages is lim...
原创
2018-09-04 15:21:59 ·
1415 阅读 ·
0 评论