VS2010调用tesseract步骤

我的tesseract安装路径为D:\Tesseract-OCR,如果你的安装路径和我不一样,将这份文档里所有的D:\Tesseract-OCR改为你的安装路径即可。
1. 下载lib和dll(所有需要下载的东西在附件里下载)

Ø 首先安装tesseract-ocr-setup-3.02.02.exe文件,我的安装路径为D:\Tesseract-OCR;

Ø 安装完成后解压tesseract-3.02.02-win32-lib-include-dirs.zip文件,将里面的lib和include文件夹复制到Tesseract-OCR目录下;

Ø 最后解压缩  liblept168和VS2010编译出的libtesseract302.rar  文件,将该压缩文件里的三个dll文件复制到Tesseract-OCR\lib目录下,替换该目录下的文档

(原因:该目录下被替换的文档时在VS2008平台下编译生成的,替换的文档则是VS2010平台下生成的,这个事从网上直接找的)

Ø 将chi_sim.traineddata.gz解压缩,然后将chi_sim.traineddata复制到D:\Tesseract-OCR\tessdata下,这是已经有的简体中文训练集

2. 检查并修改环境变量

一般情况下环境安装好tesseract后环境变量就自动配置好了,但是为了确保后面不出错,最好还是检查一下,在环境变量Path中增加指向安装目录下lib的路径,比如D: \Tesseract-OCR\lib  ,以便exe运行时能找到所需要的dll。

Ø 还有一步特别重要,就是一定要查看环境变量TESSDATA_PREFIX,将其路径改到D:\Tesseract-OCR\下。

3.然后需要添加包含的库和目录,如下:(我新建的工程名为test)

(1) 在工程(不是解决方案)上单击右键,选择属性,依次单击配置属性——C/C++——常规,在右侧找到附加包含目录,该目录下添加D: \Tesseract-OCR\include\tesseract;

(2) 配置属性——链接器——常规,找到附加库目录,添加D: \Tesseract-OCR\lib

 4.新建一个C++工程,我建的是一个空的win3程序。建好后新建一个CPP文件,添加这几行代码:

#include"stdafx.h" 
#include "strngs.h"  
#include "baseapi.h"

#include <iostream>

using namespace std;

#pragma  comment(lib," D:\\Tesseract-OCR\\lib\\libtesseract302d.lib ") 

int main()

{

char * str = "D:\\20.jpg";  //这是要识别图像的绝对路径

tesseract::TessBaseAPI  api;    

api.Init(NULL, "chi_sim", tesseract::OEM_DEFAULT); 

 //初始化,设置语言包,中文简体:chi_sim;英文:eng;也可以自己训练语言包  

STRING text_out;   //定义输出的变量 

if (!api.ProcessPages(str, NULL, 0, &text_out))    

{    

return 0;    

}

cout<<text_out.string();  //输出到命令行中

}

然后运行文件,可以发现将识别出的文字显示在了命令行中。
原文:https://blog.csdn.net/qq_26898461/article/details/46728041 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
vs(Visual Studio)是一款功能强大的集成开发环境,而tesseract是一个开源的OCR(光学字符识别)引擎。在使用vs调用tesseract时,我们需要按照以下步骤进行设置和操作。 首先,我们需要在vs中创建一个新的项目,并在项目的解决方案资源管理器中添加tesseract的库文件。这可以通过将库文件的路径添加到项目的“附加包含目录”中来实现。 接下来,在项目的代码中,我们需要包含tesseract的头文件,并使用tesseract的API函数来实现OCR功能。通过调用API函数,我们可以加载图像或文本文件,并将其传递给tesseract引擎进行识别。 在调用tesseract之前,我们还可以对图像进行预处理,例如调整图像的大小、灰度化、二值化等,以便提高识别的准确性。这些预处理步骤可以使用vs的图像处理库或其他第三方库来完成。 在调用tesseract引擎之后,我们可以使用其提供的函数来访问识别结果。这些结果可以是识别出的文本或识别的字符等。我们可以将这些结果保存到文件中,或在vs的输出窗口中显示出来。 最后,在使用完tesseract后,我们需要释放其占用的内存,并进行清理操作,以确保程序的正常结束。 总的来说,使用vs调用tesseract可以使我们方便地实现OCR功能,并应用于各种需要文字识别的项目中,如自动化文档处理、文字搜索等。通过合理设置和操作,我们可以提高识别的准确性和效率,从而实现更好的识别结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值