Tesseract-ocr 文字识别软件的应用(2)——Tesseract在VS 2013的中文字库的调用

本文介绍了如何在VS2013中配置和使用Tesseract OCR引擎进行中文识别,包括下载中文字库、安装字库到工程目录,并提供了测试识别的效果。在识别过程中,注意到识别中文所需时间较长,寻求优化建议。
摘要由CSDN通过智能技术生成

Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。 Tesseract最初由HP公司开发,后来由Google维护。

大部分人都是希望能把自己的字库放在Tesseract调用,做成自己的开发包。网上找了很久,在C++环境下,中文字库或者其他的字库该怎么调用。大部分人云亦云,说不得不清不楚,因此这里特别给出。

一、下载Tesseract-ocr3.02库的中文字库,(地址https://download.csdn.net/download/pingdenghuli/10510421 )

Tesseract-ocr3.02里面默认带着eng英文字库,中文字库需要自己下载,因此特意把所有文件打包(chi+eng+vs2013配置使用文件,有积分的支持一下,没有积分的发邮箱在评论,发给你)

二、新建工程文件photo1

参考

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值