Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata“ directory但环境变量已设

对流层顶的圆白菜

已于 2022-09-28 14:21:52 修改

阅读量2.4k

点赞数 6

分类专栏：捕捉BUG 文章标签： python

于 2022-06-18 17:45:28 首次发布

本文链接：https://blog.csdn.net/m0_45208018/article/details/125349498

版权

捕捉BUG 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

错误描述

Tesseract-OCR的英文识别模式（leng='eng')可以运行，但中文简体模式及其他语言模式不行，比如：

pytesseract.image_to_string(im_crop,lang = 'chi_sim')

TesseractError: (1, 'Error opening data file C:\\Program Files\\Tesseract-OCR\\tessdata\\chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

尝试解决

按报错提示和网上教程添加环境变量：

但并没有解决...

最终解决

重新下载所需要的.traineddata文件，在tessdata文件中替换原来的，运行成功！https://github.com/tesseract-ocr/tessdatahttps://github.com/tesseract-ocr/tessdata

原因探讨

我的tessdata中的文件都是安装Tesseract-OCR时自动生成的，虽然看起来想要的traineddata格式的文件它都有，但除了eng.traineddata外，每个都只有7kb，而在Github上下载则发现每个文件需40兆左右......于是才猜到是文件的问题，只是不知道为什么会一直报环境变量的错。

对流层顶的圆白菜

关注

6
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata“ directory但环境变量已设

Tesseract-OCR的英文识别模式（leng='eng')可以运行，但中文简体模式及其他语言模式不行。环境变量已设置，还是Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
复制链接

扫一扫