Tesseract-OCR 字符识别---样本训练

最新推荐文章于 2024-05-31 16:07:47 发布

置顶

firehood

最新推荐文章于 2024-05-31 16:07:47 发布

阅读量5.5w

点赞数 15

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/firehood_/article/details/8433077

版权

Tesseract是一个开源的OCR（Optical Character Recognition，光学字符识别）引擎，可以识别多种格式的图像文件并将其转换成文本，目前已支持60多种语言（包括中文）。 Tesseract最初由HP公司开发，后来由Google维护，目前发布在Googel Project上。地址为http://code.google.com/p/tesseract-ocr/。

使用默认的语言库识别

1.安装Tesseract

从 http://code.google.com/p/tesseract-ocr/downloads/list下载Tesseract，目前版本为Tesseract3.02。因为只是测试使用，这里直接下载winodws下的安装文件tesseract-ocr-setup-3.02.02.exe。安装成功后会在相应磁盘上生成一个Tesseract-OCR目录。通过目录下的tesseract.exe程序就可以对图像字符进行识别了。

2.准备一副待识别的图像，这里用画图工具随便写了一串数字，保存为number.jpg，如下图所示：

3. 打开命令行，定位到Tesseract-OCR目录，输入命令：

 tesseract.exe

最低0.47元/天解锁文章

关注

15
点赞
踩
103

收藏

觉得还不错? 一键收藏
27
评论
Tesseract-OCR 字符识别---样本训练

Tesseract是一个开源的OCR（Optical Character Recognition，光学字符识别）引擎，可以识别多种格式的图像文件并将其转换成文本，目前已支持60多种语言（包括中文）。 Tesseract最初由HP公司开发，后来由Google维护，目前发布在Googel Project上。地址为http://code.google.com/p/tesseract-ocr/。
复制链接

扫一扫

firehood CSDN认证博客专家 CSDN认证企业博客

码龄16年

52: 原创

23万+: 周排名

217万+: 总排名

47万+: 访问

: 等级

4282: 积分

441: 粉丝

179: 获赞

347: 评论

379: 收藏

私信

关注

热门文章

最新评论

STM32 简单多任务调度
愤斗小人: 这样有个问题，如果g_TimingTick大于64位的最大值怎么办
H264视频编码成MP4文件
qq_38369975: 转出来的图像很花呀=。=
H264视频编码成MP4文件
prefectsli: 你好，可以向你请教下关于h264实时包怎么解析合成mp4的吗
OpenCV 视频人数统计研究
莫柠866: 楼主你好，我看了您的文章，感觉对于我正在做的东西有很大的帮助，虽觉张口请教代码过于冒昧，但还是希望能有请教的机会。希望得到您的答复，我的邮箱是3314765443@qq.comqq.com
H264视频编码成MP4文件
qq_40094384: java能用吗

最新文章

目录

评论 27

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。