使用Tesseract-OCR识别图片上的中文

最新推荐文章于 2024-03-21 22:37:35 发布

LinJingke

最新推荐文章于 2024-03-21 22:37:35 发布

阅读量2.2k

点赞数 1

分类专栏： Mac

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Linjingke32/article/details/72871024

版权

Mac 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

本文基于Mac系统测试，Windows系统请参考其GitHub网站上的编译说明进行使用。

在GitHub上下载最新版本的Tesseract，目前最新是3.05.01，注意，对中文识别的支持需要版本3.0以上:

下载好tesseract解压后，目录结构如下:

可以看到，功能可以移植到android平台上，使用的是jni的方式，这里后面再尝试了。

安装依赖库，这里使用的是homebrew安装的方式：brew install automake autoconf autoconf-archive libtool pkgconfig icu4c leptonica gcc

安装好依赖库后，进入tesseract根目录：

按照提示，继续下一步:

./configure CC=gcc CXX=g++ CPPFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib

报如下错误：

囧~居然还不支持当前系统版本，目前brew下载的最高是1.72版本，但是要求1.74版本，因此，brew remove liptonica，采用手动下载源码的方式来安装这个依赖，现在去下载1.74.2版本的，下载解压后目录结构如下:

为了生成configure文件，这里先执行"./autobuild"脚本:

完成后，执行"./configure"，从而生成makefile文件:

然后执行"make && make install"即可，接着，导出环境变量，也可以通过修改"~/.bash_profile"永久修改:

安装完成Leptonica1.74版本后，进入tesseract根目录：

执行完，执行configure生成makefile文件:

然后执行"make && make install"即可。

如果要生成训练工具，用于对文字识别进行训练，还可继续执行："make training && make training-install"即可。

重启命令行终端，如下输出即安装成功tesseract:

下面使用一张图片来试下识别效果怎样，为了识别中文，还需要中文字库，去百度找到下载即可：

解压后把字库拉到一个文件夹先，先测试功能行不行，按照命令行提示操作，包如下错误：

原来字库是要放到/usr/local/share/tessdate下，看看那里现在有什么：

现在把下载的中文字库放到这个目录下：

现在来试试识别这张图片:

命令如下：(也可通过java代码方式调用，有库tess4j可以使用，具体可以了解下，其源码地址：http://sourceforge.jp/projects/sfnet_tess4j/)

“-l”参数说明使用的语言包，这里使用刚刚下载的chi_sim包, “1.png”是要检测的图片部分，图片最好预选使用其他工具，如OpenCV切割到只剩下文字部分，否则识别不出来，result是输出结果，默认后缀名就是txt了。

识别结果如下：

"名'"这个字识别不了。

---------------------------------------------------

下面来训练一下，下载jTessBoxEditor，它需要Java环境的支持，这里我下载1.7.3版本的:

下载完成解压后目录如下：

准备几张图片来进行识别的图片库，如下：

这里的三张图片其实是一样的，复制而已，偷下懒，其实可以自己从不同角度拍照获取作为识别，这样后期的识别精度更高。

运行jTessBoxEditor:

注意，图片需要是tiff格式，用于后面生成box文件，还有一点，图片的命名有要求：[lang].[fontname].exp[num].tiff，lang是语言，fontname是字体，num是编号，现在需要训练自定义字库name字体名为jim，则命名为: name.jim.exp0.tiff，最后修改为如下：

进入jTessBoxEdtior，选择菜单栏如下：

弹出如下窗口，选择我们的三张图片，然后输入名称，点击"Save":

合并后的图片如下：

接下来，生成BoxFile文件：(为了便于测试，我们复制刚刚的一份字库，命名为chi_jim),如下：

生成：

现在软件切换到BoxEditor界面：

然后打开刚刚合并的tif图片文件：

我们手动修改错误的地方，合并“禾”与“斗”，结果如下，然后点击"Save"保存矫正后的数据：

现在就进行训练，生成了tr后缀的文件：

生成unicharset文件：

新建文件：

文件内容为：

继续执行如下命令：

1.

2.

3.

最后目录如下：

现在将unicharset、inttemp、pffmtable、shapetable、normproto这5个文件前面都加上"normal.":如下：

最后，生成训练结果文件：

把这个文件拷贝到字库路径下，并重新识别一次看看效果怎样，可以看到，训练后识别都正确了：

后面就是根据需要，不断完善自己的语言识别库了，步骤也类似这样去进行处理。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
使用Tesseract-OCR识别图片上的中文

1. 准备工作在GitHub上下载最新版本的Tesseract，目前最新是3.05.01，注意，对中文识别的支持需要版本3.0以上: 另外，还需要Tesseract中文语言包：下载好tesseract后，目录结构如下: 可以发现，功能其实可以移植到android平台的，使用jni的方式。接着下载CPPA
复制链接

扫一扫

专栏目录

LinJingke CSDN认证博客专家 CSDN认证企业博客

码龄12年

128: 原创

4万+: 周排名

176万+: 总排名

62万+: 访问

: 等级

4935: 积分

102: 粉丝

90: 获赞

53: 评论

421: 收藏

私信

关注

热门文章

分类专栏

MyBatis从零开始 6篇
-----Databases----- 10篇
MySQL 5篇
JAVA 15篇
QT/C++ 3篇
Unix/Linux 29篇
PYTHON 22篇
SVN 1篇
iOS 2篇
WebServer 5篇
Spring 6篇
Android 14篇
Docker 5篇
Database 17篇
React Native
Mac 16篇
Windows 9篇
Parallel Programming 1篇
Git 1篇
Cocos2d-x 1篇
Mini Programme
Android Things 8篇
Java EE 4篇
MatLab 2篇
OpenCV 9篇
NN/ML 8篇
Frontend 3篇
CUDA 1篇
Kafka 3篇

最新评论

Linux下编译安装OpenCV(基于C++，生成so库供python调用)
烂柯人8: 在本机编译好的cv2.so，在别的环境中无法正常调用，会提示少很多.lib包，博主有遇过吗
Git (一) 文件内容与其散列值
Mader~xiu: 现在看不懂，晚些我再回来看。
Mac下pip安装pymssql报错“brew install freetds”解决
qq_31105345: 我也是brem install freetds。然后依然是没办法装pymssql，依然报同个错。
Windows平台编译MySQL5.7源码
世界还赞颂沉默吗: bison下载页面：http://gnuwin32.sourceforge.net/packages/bison.htm，另外还得下个openssl
MySQL通过UDF实现扩展功能（Linux环境和Windows环境）
LaOngDaoxing: 3、对于Windows有.dll文件，Linux有.so文件的下载地址。 https://github.com/rapid7/metasploit-framework/tree/master/data/exploits/mysql 4、将lib_mysqludf_sys_64.dll，复制到此处或等同于您的MySQL安装： D:\developsoft\database\mysql\mysql5.5_win64\soft\lib\plugin\lib_mysqludf_sys_64.dll

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。