VS2015+Tesseract4配置与示例(修改版)全套库类实例

声明本文的资源及内容引用这位仁兄(https://blog.csdn.net/andylanzhiyong/article/details/81807425)的文章

我只不过是增加了一个50.2MB的最新识别库罢了(识别率更高了些)

增加了最新中文识别库 50.2MB的那个! 

整套资源下载地址:https://download.csdn.net/download/blackangelboy/12255296

 

 

附上代码

附上下载修改版VS2015+Tesseract4全套编译库地址

#include<iostream>
#include <stdio.h>
#include<windows.h>
#include "leptonica/allheaders.h"
#include "tesseract/capi.h"
using namespace std;


void die(const char *errstr) {
    fputs(errstr, stderr);
    exit(1);
}


void ConvertUtf8ToGBK(char **amp, char *strUtf8)  //转码
{
    int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)strUtf8, -1, NULL, 0);
    unsigned short * wszGBK = new unsigned short[len + 1];
    memset(wszGBK, 0, len * 2 + 2);
    MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)strUtf8, -1, (LPWSTR)wszGBK, len);
    len = WideCharToMultiByte(CP_ACP, 0, (LPCWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
    //char *szGBK=new char[len + 1]; 
    *amp = new char[len + 1];
    memset(*amp, 0, len + 1);
    WideCharToMultiByte(CP_ACP, 0, (LPCWSTR)wszGBK, -1, *amp, len, NULL, NULL);
}

int main(int argc, char *argv[]) {
    TessBaseAPI *handle;
    PIX *img;
    char *text = NULL;
    //读取图片,原图像的路径 
    if ((img = pixRead("test.jpg")) == NULL)
        die("Error reading image\n");

    handle = TessBaseAPICreate();
    //加载字库及设置语言
    if (TessBaseAPIInit3(handle,"./tessdata", "eng+chi_sim") != 0)
        die("Error initialising tesseract\n");

    //设置图片及识别
    TessBaseAPISetImage2(handle, img); 
    if (TessBaseAPIRecognize(handle, NULL) != 0)
        die("Error in Tesseract recognition\n");

    if ((text = TessBaseAPIGetUTF8Text(handle)) == NULL)
        die("Error getting text\n");

    char *pResult = NULL;
    ConvertUtf8ToGBK(&pResult, text); //对结果转码
    cout << pResult << endl;   //输出OCR识别的文本信息
    delete pResult;

    system("pause");
    TessDeleteText(text);
    TessBaseAPIEnd(handle);
    TessBaseAPIDelete(handle);
    pixDestroy(&img);

    return 0;
}
 

VS2019 是微软推出的一款集成开发环境,用于开发各种软件应用和项目。它提供了丰富的开发工具和功能,如代码编辑器、调试器、版本控制等,简化了开发过程,提高了开发效率。 Tesseract 5 是一个开源的OCR(光学字符识别)引擎。它能够将图像中的文字转换成可编辑的文本,实现了将图片中的内容提取和识别的功能。Tesseract 5 是对之前版本的改进和升级,增加了更多语言的支持、提高了识别准确率和速度。 在使用VS2019和Tesseract 5进行开发时,我们可以通过VS2019提供的工具和功能来进行程序编写和调试。我们可以创建一个OCR应用程序,在使用Tesseract 5的API时,通过调用相应的函数来实现图像的文字识别功能。 首先,我们需要将VS2019与Tesseract 5进行集成。我们可以从Tesseract的官网下载最新的Tesseract 5的库文件和头文件,并将其添加到VS2019中的项目中。 然后,我们可以使用VS2019的代码编辑器来编写程序代码,调用Tesseract 5的函数来进行图像文字的识别。可以使用VS2019的调试器来调试代码,以确保程序的正确性和稳定性。 最后,我们可以使用VS2019的构建和发布功能,构建出一个可执行文件或者安装包,实现将OCR应用程序发布和部署到目标设备上的目的。 总的来说,VS2019和Tesseract 5 的结合可以帮助开发者快速开发出具有图像文字识别功能的应用程序,并提高开发效率和识别准确率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值