Tesseract5.0.0+OpenCV3+VS2019安装、字符识别学习

本文详细介绍了如何在Windows上使用Visual Studio 2019安装和配置Tesseract 5.0.0及OpenCV3,包括环境变量设置、字符识别、训练字符库、CMake编译和解决编译过程中的问题。此外,还涉及到Leptonica的安装和依赖库的处理。
摘要由CSDN通过智能技术生成

背景

做一个字符检测比对的小项目,需要借助Tesseract的OCR进行开发。

Visual Studio 2019安装

详见另一篇:https://blog.csdn.net/weixin_46293955/article/details/105961344

OpenCV3安装、配置

待更新…

Tesseract v5.0.0安装

tesseract v5.0.0 64位安装包下载链接: https://download.csdn.net/download/weixin_46293955/12531753

双击安装程序
点击Next
在这里插入图片描述
点击I Agree
在这里插入图片描述
选择电脑用户,点击Next
在这里插入图片描述
勾选组件
在这里插入图片描述
选择语言包:符号、数字、简体中文、简体中文(复杂)、繁体中文、繁体中文(复杂)、英文(复杂)。
未选择的情况下自带英文、数字、符号。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
自定义安装路径,这里安装到D盘Tesseract-OCR文件夹中
在这里插入图片描述
点击Install按钮安装
在这里插入图片描述
报错是由于语言包无法下载,点击确定跳过
在这里插入图片描述
等待安装完成
在这里插入图片描述
点击Finish安装完成
在这里插入图片描述
加入系统环境变量Path
在这里插入图片描述
新建环境变量TESSDATA_PREFIX,路径指向tessdata文件夹
在这里插入图片描述
安装完后文件如下图:
在这里插入图片描述
查看是否安装成功,在Windows PowerShell中下指令tesseract,出现如下回传,则表示安装成功。
在这里插入图片描述
查看支持的语言,在Windows PowerShell中下指令tesseract --list-langs,此处语言放在tessdata文件夹中。
在这里插入图片描述
语言包下载链接: 待更新

在Windows PowerShell中下指令识别字符

放置一张图片至D盘,命名为ROI.jpg(图片为在百度随机截取,侵删)
在这里插入图片描述
在Windows PowerShell中下指令tesseract D:\ROI.jpg D:\1
回传如下,可以看到识别为空。原因是文字太小或者太模糊(图截得很小)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值