python 利用tesseract识别文字报错(内含中文包下载地址)

已安装tesseract-ocr-w32-setup-v4.0.0.20181030.exe(tesseract下载地址),已配置系统环境,python已下载pytesseract模块,

运行程序时仍报错:pytesseract.pytesseract.TesseractError: (1, 'Error opening data file C:\\Program Files (x86)\\Tesseract-OCR/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

有可能是你没有安装中文包‘chi_sim’

可以通过tessdata目录查看是否安装中文包,如下图则为未安装

各版本语言包下载路径:

https://github.com/tesseract-ocr/tesseract/wiki/Data-Files

由于我安装的tesseract-ocr是4.0版本的,所以这里下载的中文包是4.0的

继续往下翻还有别的版本对应的语言包,按需所取

下载好以后,把中文包放置在tessdata目录下即可。

 

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值