VS2013 Update5 + Tesseract 3.04 API 编译 配置

编译

在C盘创建一个文件夹叫tesseract-build
切换到该文件夹下,输入下面命令

git clone https://github.com/charlesw/tesseract-vs2012.git


打开 VS 2013 Developer Command Prompt (VS2013 开发人员命令提示)切换到C:\tesseract-build\tesseract-vs2012
执行下面命令 msbuild build.proj

结束以后显示300多个警告,0个错误,代表这一步成功了。
C:\tesseract-build\tesseract-vs2012\release 下的include lib 复制到C:\tesseract-build下。
C:\tesseract-build\tesseract-vs2012 里的 vs2013+64bit_support.patch 复制到C:\tesseract-build下。

git clone https://github.com/tesseract-ocr/tesseract.git

切换到tesseract文件夹,右键运行git bash
执行

git checkout -b 3.04-vs2013 3.04.00
git am --signoff < ../vs2013+64bit_support.patch

打开C:\tesseract-build\tesseract\vs2013\tesseract.sln ,按F7生成解决方案。Release和Debug都生成一下。

配置

C:\tesseract-build\lib\Win32里的liblept开头的文件复制到C:\tesseract-build\lib

新建工程,在项目属性页的包含目录中添加:

C:\tesseract-build\include
C:\tesseract-build\include\leptonica

在库目录中添加:

C:\tesseract-build\lib

附加依赖项中添加:

liblept171.lib
libtesseract304.lib

libtesseract304.dlllibtesseract304d.libliblept171.dllliblept171d.dll拷贝到C:\Windows\System32和C:\Windows\System目录下。

测试代码
#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
#include <opencv2\opencv.hpp>
#include <tesseract\baseapi.h>
#include <iostream>
#include <stdlib.h>

tesseract::TessBaseAPI ocr;

char* identifyText(cv::Mat input, char* language = "eng")
{
    ocr.Init(NULL, language, tesseract::OEM_TESSERACT_ONLY);
    ocr.SetPageSegMode(tesseract::PSM_SINGLE_BLOCK);
    ocr.SetImage(input.data, input.cols, input.rows, 1, input.step);
    char* text = ocr.GetUTF8Text();
    std::cout << "Text:" << std::endl;
    std::cout << text << std::endl;
    std::cout << "Confidence:" << ocr.MeanTextConf() << std::endl;
    return text;
}

int main(int argc, char* argv[])
{
    cv::Mat image = cv::imread("D:/2.jpg", 0);
    if (image.empty())
    {
        return -1;
    }
    cv::Mat binary;
    cv::threshold(image, binary, 100, 255, CV_THRESH_BINARY);
    identifyText(binary);
    system("pause");
    return 0;
}
VS2019 是微软推出的一款集成开发环境,用于开发各种软件应用和项目。它提供了丰富的开发工具和功能,如代码编辑器、调试器、版本控制等,简化了开发过程,提高了开发效率。 Tesseract 5 是一个开源的OCR(光学字符识别)引擎。它能够将图像中的文字转换成可编辑的文本,实现了将图片中的内容提取和识别的功能。Tesseract 5 是对之前版本的改进和升级,增加了更多语言的支持、提高了识别准确率和速度。 在使用VS2019和Tesseract 5进行开发时,我们可以通过VS2019提供的工具和功能来进行程序编写和调试。我们可以创建一个OCR应用程序,在使用Tesseract 5的API时,通过调用相应的函数来实现图像的文字识别功能。 首先,我们需要将VS2019与Tesseract 5进行集成。我们可以从Tesseract的官网下载最新的Tesseract 5的库文件和头文件,并将其添加到VS2019中的项目中。 然后,我们可以使用VS2019的代码编辑器来编写程序代码,调用Tesseract 5的函数来进行图像文字的识别。可以使用VS2019的调试器来调试代码,以确保程序的正确性和稳定性。 最后,我们可以使用VS2019的构建和发布功能,构建出一个可执行文件或者安装包,实现将OCR应用程序发布和部署到目标设备上的目的。 总的来说,VS2019和Tesseract 5 的结合可以帮助开发者快速开发出具有图像文字识别功能的应用程序,并提高开发效率和识别准确率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值