tesseract-ocr中文识别

Ponnyao

已于 2022-07-11 11:10:10 修改

阅读量2.1k

点赞数 4

分类专栏：深度学习文章标签： opencv python

于 2022-06-14 09:35:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41426807/article/details/125264845

版权

深度学习专栏收录该内容

11 篇文章 3 订阅

订阅专栏

Tesseract-OCR 是一款由HP实验室开发由Google维护的开源OCR（Optical Character Recognition , 光学字符识别）引擎。与Microsoft Office Document Imaging（MODI）相比，我们可以不断的训练的库，使图像转换文本的能力不断增强；如果团队深度需要，还可以以它为模板，开发出符合自身需求的OCR引擎。

一、环境配置

1、下载

Index of /tesseract

我下载了最后一个最新的，下载完成直接安装。

2、环境变量配置

为了在任意终端可以使用，需配置环境变量。

在用户变量和系统变量的Path中添加ocr的安装路径。

3、中文环境配置

要是中文环境不能用，打开tessdata_fast ,下载简体中文包。

将下载好的文件复制到安装目录下的tessdata文件夹中。

二、测试

1、测试文件准备

网上随便截了张图放在下面文件夹。

2、测试过程

在此文件夹执行cmd命令，回车，弹出终端。

在弹出的终端中输入以下命令。

tesseract 图片 要保存文件名 -l 中文包

tesseract test.png 中文测试 -l chi_sim

执行完成，在图片所在目录生成txt文件。

3、查看结果

准确度还可以。

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
2
评论
tesseract-ocr中文识别

tesseract-ocr5.0中文环境配置
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ponnyao 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。