OCR 开源软件 Tesseract 的下载和入门使用

最新推荐文章于 2024-05-09 13:53:33 发布

在行进路上

最新推荐文章于 2024-05-09 13:53:33 发布

阅读量310

点赞数

分类专栏：开发笔记

开发笔记专栏收录该内容

15 篇文章 1 订阅

订阅专栏

资源下载

tesseract-ocr-setup-3.05.01.exe
注：安装的时候选好要识别的语言

tesseract-4.0-with-LSTM#400-alpha-for-windows

Windows中运行tesseract

1.tesseract 是一个命令行OCR程序，打开一个终端（组合键Win +R），输入：

tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]

imagename
The name of the input image. Most image file formats (anything readable by 
Leptonica) are supported.(输入图片的文件名，可以是Leptonica支持的各种图片格式)

outputbase
The basename of the output file (to which the appropriate extension will be 
appended). By default the output will be named outbase.txt.(输出文件的文件名，
默认输出文件是txt格式的，还可以指定Hocr和pdf格式)

2.举个栗子：识别myscan.png 图像，将识别结果存入out.txt，命令行：

tesseract myscan.png out

3.指定特定语言，指定识别简体中文和英文-l chi_sim+eng,命令行：

tesseract myscan.png out -l chi_sim+eng

4.指定输出文件格式，在命令行最后加上文件格式即可，可以指定Hocr和pdf格式，hOCR是
是一种HTML文件，它对每个识别的字词会后一些参数的说明。tesseract 3.03及以上的版本才
支持pdf格式，命令行为：

hOCR: tesseract myscan.png out hocr
pdf: tesseract myscan.png out pdf

Github 参考文件

运行tesseract
参数说明

本文转自：https://blog.csdn.net/cylj102908/article/details/78760777

在行进路上

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

在行进路上 CSDN认证博客专家 CSDN认证企业博客

码龄8年

119: 原创

-: 周排名

11万+: 总排名

19万+: 访问

: 等级

1936: 积分

17: 粉丝

19: 获赞

15: 评论

115: 收藏

私信

关注

热门文章

分类专栏

java 3篇
c++ 6篇
flex 13篇
FMS 3篇
php 32篇
Html 1篇
pc疑难杂症 2篇
js 12篇
mysql 12篇
杂文 4篇
linux 10篇
缓存相关 3篇
Oracle 2篇
项目管理 6篇
系统架构 1篇
HTML5 1篇
开发笔记 15篇
c# 5篇

最新评论

ImageMagick (Magick++ for C++) configuration in Visual Studio 2017
Alohaq: 有未经处理的异常: Microsoft C++ 异常: Magick::ErrorMissingDelegate，位于内存位置 0x000000C53850F590 处。出现了这样的错误，有人遇到过吗？
GDI+图像合并
king1027: 这也能叫合并？
linux-中标麒麟下安装 mysql5.7.28
hack400: cp /usr/local/src/mysql/support-files/mysql.server /etc/init.d/mysql 这个地方错了应该是, cp /usr/local/mysql/support-files/mysql.server /etc/init.d/mysql
MFC对话框窗口分割/拆分
哈哈Lee: 感谢大佬，问题解决了。搜了全网，代码都是复制粘贴，没一个能运行的。感谢！！！
MFC对话框窗口分割/拆分
Clare_CPU: 单纯记录一下运行过程中的问题：运行中在createView部分出现断点，这可能是创建对话框的问题，我一开始创建的dialog运行报错，后来改成资源视图里右键》选择添加资源》选择dialog下拉列表中的IDC_FORMVIEW就可以运行了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。