最近在做一个有关图像识别的项目,在这个过程中研究过许多算法也尝试写过,但效果不怎么好。后来别人建议我用开源类库Tesseract。由于网上大部分都是C++实现的,官网又是全英文的,于是走过许多弯路。下面写下自己学习的体会。
官网上现在有最新安装版tesseract-ocr-3.02.exe,安装后就直接可以通过cmd调用。安装包中默认有英文语言包,要识别中文需要另外引入中文语言包。点
最近在做一个有关图像识别的项目,在这个过程中研究过许多算法也尝试写过,但效果不怎么好。后来别人建议我用开源类库Tesseract。由于网上大部分都是C++实现的,官网又是全英文的,于是走过许多弯路。下面写下自己学习的体会。
官网上现在有最新安装版tesseract-ocr-3.02.exe,安装后就直接可以通过cmd调用。安装包中默认有英文语言包,要识别中文需要另外引入中文语言包。点