ocr项目———tesserct 的安装识别（中文）和重新训练

最新推荐文章于 2024-08-04 14:59:50 发布

梦游--

最新推荐文章于 2024-08-04 14:59:50 发布

阅读量1k

点赞数 3

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhouguangfei0717/article/details/102915319

版权

首先我们先来说一下现有的开源的字符识别的工具

参考：https://www.cnblogs.com/wzben/p/5930538.html

tesseract字符识别：

1：安装

tesseract下载地址：https://digi.bib.uni-mannheim.de/tesseract/

进入下载页面，可以看到有各种.exe文件的下其中文件名中带有dev的为开发版本，不带dev的为稳定版本，可以选择下载不带dev的版本，例如可以选择下载tesseract-ocr-setup-3.05.02.exe。下载列表，这里可以选择下载3.0版本。

2：测试

版本打印：tesserct -v 可以看到版本信息。

执行tesseract test.jpg result （test.jpg是测试的图像，result是输出的txt文件，会自己生成的）

3：报错

在安装完tesseract, pytesseract后执行测试命令，发现打印如下错误：

Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.Failed loading language 'eng' Tesseract couldn't load any languages! Could not initialize tesseract.

一看上面的提示就是路径有问题，windows路径是\的
解决办法，添加TESSDATA_PREFIX的环境变量，设置为安装目录下的tessdata目录 <

最低0.47元/天解锁文章

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
ocr项目———tesserct 的安装识别（中文）和重新训练

首先我们先来说一下现有的开源的字符识别的工具参考：https://www.cnblogs.com/wzben/p/5930538.htmltesseract字符识别：1：安装tesseract下载地址：https://digi.bib.uni-mannheim.de/tesseract/进入下载页面，可以看到有各种.exe文件的下其中文件名中带有dev的为开发版本，不带dev...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。