Tesseract-OCR入门使用（1）-安装包获取和命令行调用

最新推荐文章于 2024-09-06 22:09:19 发布

我不是校长

最新推荐文章于 2024-09-06 22:09:19 发布

阅读量1.9w

点赞数 4

分类专栏： Tesseract-OCR入门使用 Tesseract-OCR入门使用文章标签：开源 OCR Tesseract Google

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012566751/article/details/54094692

版权

Tesseract-OCR入门使用同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

Tesseract-OCR入门使用

3 篇文章 7 订阅

订阅专栏

本文简单介绍 Tesseract-OCR 3.x版本如何上手使用，只适用于入门级别。

目录

1.开源协议

2.安装包获取

3.运行Tesseract-OCR命令行

3.1检测Tessseract-OCR是否安装成功

3.2查看Tesseract-OCR支持语言

3.3利用Tesseract-OCR识别

1.开源协议

Tesseract-OCR遵循Apache 2.0 license开源协议，因此可用于商业用途。不过使用前最好明确了解协议。

2.安装包获取

（1） Tesseract 3.05（目前更新至4.0）

目前只有非官方安装包下载地址： Tesseract at UB Mannheim

（其中包含训练工具）

（2） Tesseract 3.02

官方安装包下载地址： download

因为只包含英文语言包，如果需要其他语言包下载地址： download the appropriate training data

并将语言包解压至 tessdata目录。

3.运行Tesseract-OCR命令行

Tesseract-OCR 安装后包含一个命令行程序。

（以下操作基于）Tesseract3.02版本

3.1检测Tesseract-OCR 是否安装成功

（以下操作基于）Tesseract3.05版本

step1 ：进入cmd窗口

step2 ：录入 cd 【Tesseract-OCR安装目录】，进入 Tesseract-OCR安装目录

step3 : 录入 tesseract ，如果显示以下信息则安装成功

（以下操作基于）Tesseract3.02版本

step1 ：进入cmd窗口

step2 : 录入 tesseract 回车，如果显示以下信息则安装成功

3.2查看Tesseract-OCR支持语言

tesseract --list-langs

3.2利用Tesseract-OCR识别

tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]

test1：测试识别

tesseract D:\huilang\1.jpg D:\out

运行结果

test2：测试语言选择

tesseract D:\huilang\1.jpg D:\out -1eng

PS: [-l lang]实际使用中是不能由空格的，否则提示无法打开

test3：测试输出格式

tesseract D:\huilang\1.jpg D:\out -1eng pdf

确实生成PDF文件了，虽然不是我想要的：）

参考资料：

1.《 OCR----Tesseract 3.x架构及原理解析》，作者思路明确值得一看

2.《 [译] 理解 LSTM 网络》 http://www.jianshu.com/p/9dc9f41f0b29

3.《 Tesseract:安装与命令行使用》

我不是校长

关注

4
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。