python 利用tesseract识别文字报错（内含中文包下载地址）

最新推荐文章于 2025-04-02 15:20:05 发布

不知名程序媛

最新推荐文章于 2025-04-02 15:20:05 发布

阅读量5.3k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44606217/article/details/103732151

版权

已安装tesseract-ocr-w32-setup-v4.0.0.20181030.exe（tesseract下载地址），已配置系统环境，python已下载pytesseract模块，

运行程序时仍报错：pytesseract.pytesseract.TesseractError: (1, 'Error opening data file C:\\Program Files (x86)\\Tesseract-OCR/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

有可能是你没有安装中文包‘chi_sim’

可以通过tessdata目录查看是否安装中文包，如下图则为未安装

各版本语言包下载路径：

https://github.com/tesseract-ocr/tesseract/wiki/Data-Files

由于我安装的tesseract-ocr是4.0版本的，所以这里下载的中文包是4.0的

继续往下翻还有别的版本对应的语言包，按需所取

下载好以后，把中文包放置在tessdata目录下即可。

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。