最近在做一个OCR识别相关项目,前期花了不少时间,最终用Tesseract这个比较成熟的开源项目,在研究Tesseract的过程中走了一些弯路,目前识别结果还比较满意,现在准备每天抽些时间,把自己的一些心得整理起来,以供大家参考,因为我也是才研究一两个月,理解不是很到位,欢迎大家指正。我准备从以下几个方面来介绍
- Tesseract简介
- Tesseract编译
- Windows
- Linux
- 把Tesseract嵌入到OpenCV中
- Tesseract训练
- 如何提高图片识别质量
- Tesseract v3 训练
- Tesseract v4 训练
- 如何从头开始训练
- 如何做Fine Tuned
- 需要注意的事项
- VGSLSpecs 介绍
- 如何针对具体项目使用Tesseract
Tesseract 的历史比较长了,在网上可以找到很多关于它的相关介绍,这里不做赘述,最早是惠普开发的一个OCR识别引擎,历经几十年,现在是谷歌在开发维护。要掌握它必须看官网的介绍,这是它的官网地址 https://github.com/tesseract-ocr,不懂的可以看wiki,或者在google的Tesseract-OCR论坛上发帖提问,很快会有响应。
先想这么多了,后面再做修正