tesserocr是python中的ocr识别库,是对 tesseract 做的一 层 python API 封装,其核心是 tesseract。 在安装 tesserocr 之前,先安装 tesseract
1. windows下安装tesseract
tesseract下载地址 :http://digi.bib.uni-mannheim.de/tesseract
tesseract语言包:http://github.com/tesseract-ocr/tessdata
选择需要的版本,双击安装
安装时,可以勾选Additional language data(download)来选择需要安装的语言包,可以多选几个,来识别多国语言,个人选的是中文跟英文

2. tesseract配置环境变量
1)将tesseract安装路径添加到path环境变量中
'D:\others\tesseract' 命令行中输入tesseract,没报错则安装成功
2)将tesseract的语言包添加到环境变量中,新建一个系统变量,名称为TESSDATA_PREFIX,路径为放置语言包的路径,tessdata所在路径
'D:\others\tesseract\tessdata'

最低0.47元/天 解锁文章

519

被折叠的 条评论
为什么被折叠?



