tesseract-Oct的简单使用（入门）以及安装包下载

最新推荐文章于 2024-07-29 16:52:17 发布

WillWinwin

最新推荐文章于 2024-07-29 16:52:17 发布

阅读量2.9k

点赞数

分类专栏：杂七杂八文章标签： Tesseract OCR 图像识别识别字符图片转换

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013816144/article/details/50199973

版权

杂七杂八专栏收录该内容

14 篇文章 0 订阅

订阅专栏

下载地址：点我

简单介绍：Tesseract是一个开源的OCR（Optical Character Recognition，光学字符识别）引擎，可以识别多种格式的图像文件并将其转换成文本，目前已支持60多种语言（包括中文）。也就是说它可以识别出图片当中的多种语言并转换为txt类型，比如二维码等。
安装方式：直接安装下载的exe文件即可
简单使用方式：使用命令行，cd到当前你想要识别的图片目录，然后使用tesseract xxx.jpg resault -l eng的命令即可得到对图片中文字识别的txt文件（下面有参考图）
如何添加语言库？下载链接中有一个中文字符的语言库，下载解压后直接放到tessdata目录下即可，比如：C:\Program Files (x86)\Tesseract-OCR\tessdata
对于手写字体的识别效果不会太好，因此需要训练自己的语言库，最后面有参考链接（很多时候上不去。。。。。。）

这里写图片描述

测试图片（对于标准字体的识别率特别好，中文的稍差，手写的识别效果更差）：
这里写图片描述

训练自己的语言库：

http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。