tesseract-ocr使用以及训练方法

最新推荐文章于 2024-07-24 15:36:57 发布

zhou_zhu

最新推荐文章于 2024-07-24 15:36:57 发布

阅读量2.4w

点赞数 9

分类专栏：文字识别文章标签： tesseract-ocr 中文识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhou_zhu/article/details/78004131

版权

本文详细介绍了如何使用Tesseract OCR进行中文字符识别，包括安装、使用默认库识别、训练自己的中文库，以及解决识别率问题的过程。通过训练样本、校正错误、生成训练文件等步骤，提高识别准确率。

摘要由CSDN通过智能技术生成

本人最近在做字符识别，所以自行在网上寻找方法，接触到tesseract，自己按照网上方法做的时候，也遇到一些问题，解决了一些。所以我决定写下我第一个博客，一是方便自己以后查看，更新学习。二是方便和网友交流学习。

Tesseract介绍

Tesseract是一个开源的OCR（Optical Character Recognition，光学字符识别）引擎，可以识别多种格式的图像文件并将其转换成文本，目前已支持60多种语言（包括中文）。 Tesseract最初由HP公司开发，后来由Google维护，目前发布在Googel Project上。

安装Tesseract，从http://code.google.com/p/tesseract-ocr/downloads/list下载Tesseract，3.01上的版本支持中文。安装后在电脑上会有一个Tesseract-OCR目录，通过目录录下的tesseract.exe程序就可以对图像的字符进行识别。考虑到万一有人上不了谷歌，这个Tesseract-OCR文件夹我也上传了，地址：点击打开链接。文件夹中除了Tesseract的相应文件外，还有一个tesseract-vs2013-include-lib-dll文件，这个是VS2013用来调用API的配置文件，后面的博客会写到。打开如图所示。

使用默认的语言库识别

准备一张待识别的图片，我选取一段《成都》的歌词。

最低0.47元/天解锁文章

关注

9
点赞
踩
63

收藏

觉得还不错? 一键收藏
9
评论
tesseract-ocr使用以及训练方法

本人最近在做字符识别，所以自行在网上寻找方法，接触到tesseract，自己按照网上方法做的时候，也遇到一些问题，解决了一些。所以我决定写下我第一个博客，一是方便自己以后查看，更新学习。二是方便和网友交流学习。Tesseract介绍 Tesseract是一个开源的OCR（Optical Character Recognition，光学字符识别）引擎，可以识别多种格式的图像文
复制链接

扫一扫

专栏目录

博客等级

码龄9年

2
原创

14
点赞

55
收藏

4
粉丝

关注

私信

热门文章

分类专栏

文字识别 1篇
小问题笔记

最新评论

windows在终端可以import ,但在jupyter中无法import
weixin_43911661: 怎么样添加的才是envs里面的虚拟环境？我直接运行python -m ipykernel install --user --name 环境名称 --display-name "Python (环境名称)" 还是和图片一样是 D:\\anaconda\\python.exe。是要激活虚拟环境再添加吗？
tesseract-ocr使用以及训练方法
小影~: 没有.txt也是这个错
tesseract-ocr使用以及训练方法
csdn_927: 这个问题很简单，我出错的原因是font_properties文件加了后缀.txt(font_properties.txt)，这样是不对的，总之不能加后缀,不是txt文本，就简简单单的font_properties就行了
tesseract-ocr使用以及训练方法
Handsome_Rui 回复小倜: 我也想问这个问题解决了吗
windows在终端可以import ,但在jupyter中无法import
Xtraordinaire: kernel：python -m ipykernel install --user --name 环境名称 --display-name "Python (环境名称)" 这句话--name后面写什么--display-name后面应该写什么能说清楚点吗？

最新文章

windows在终端可以import ,但在jupyter中无法import

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。