tesseract是谷歌开发并开源的图像文字识别引擎
-
首先下载安装程序,分享我的百度云地址 链接:https://pan.baidu.com/s/1AynK4CN936sjfaHyu41WIw
提取码:7358 -
下载后下一步傻瓜式安装即可,需安装到无需管理员权限的纯英文路径下即可
-
安装完成后需要添加训练数据的环境变量和可执行程序的环境变量 以TESSDATA_PREFIX为系统环境变量名,D:\tesseract-install\Tesseract-OCR\tessdata为系统环境变量值,其中D:\tesseract-install为程序安装路径
然后将D:\tesseract-install\Tesseract-OCR添加到path环境变量中即可,在命令行下键入tesseract -v回车后若返回版本信息即安装成功 如果设置环境变量后无效,那么重启机器即可。 -
命令行下使用其识别图像文字
命令行下键入 tesseract 图像文件名 返回识别结果的文件名 即可 将在当前图像文件目录下生成一个txt文件,内容即为识别结果