文本识别
前言
由于我的个人博客之前挂了,一直没来得及迁移,所以又重新拾起了csdn…
在利用python进行文本识别时,使用tesseract往往是一个非常好的选择,且tesseract支持自己训练的字库,自己训练出来的字库一般具有轻量、有针对性、识别率高的特点。本文就讲述了如何使用tesseract自己训练字库。
安装tesseract环境
- 下载Tesseract-OCR官方命令行工具:
https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-setup-3.02.02.exe/download
下载完成后安装,安装完成后,将文件根目录路径添加进系统环境变量中,打开cmd命令行,输入
tesseract -v
如果安装成功,将会出现这样的提示界面:
- 下载j