下载tesseract安装包:
一路next,中间有一个安装语言库的可勾选下载
最关键的是环境变量的设置:
- 绝对路径不能带有中文,不然报错的,所以文件啥的命名不要带有中文
- 设置环境变量,不仅仅要在path中添加Tesseract-ORC文件夹的绝对路径
- 划重点!!!还要单独新建一个环境变量,最好两个都新建,用户的环境变量和系统环境变量
名字:TESSDATA_PREFIX
路径是:Tesseract-ORC下的tessData文件夹
检查是否安装成功:
- cmd界面下:tesseract -v # 查看版本命令
- 查看语言库,tesseract --list-langs # 如果报错,请重新启动cmd,或者检查上面第三点是否做好了
- 语言库下载,官方在github可以下载
https://github.com/tesseract-ocr/tessdata_best/tree/master/script